La bonne information est sous nos yeux, encore faut-il la trouver...

Submergées par les contenus non-structurés de type mails et autres documents bureautiques, les entreprises sont confrontées au défi de la maîtrise de l’information. Principal défi : mettre la main sur la bonne donnée en premier, en vue de prendre une avance compétitive.

L’information présente au sein des entreprises a vu sa nature évoluer pour passer de données structurées à des formats plus flous tels que les emails, la messagerie instantanée et les vidéos. Submergées par les flux toujours croissants de ces contenus non-structurés qui, selon les analystes, représentent aujourd’hui 80% de leur volume global, les entreprises sont confrontées à un enjeu majeur : comment maitriser l’information, la comprendre et en faire une force ?

Depuis l'apparition des ordinateurs dans les entreprises, ce sont les hommes qui ont adapté leur méthodes et habitudes de travail au monde des machines en étant contraints par les formats très structurés de l'informatique. Mais aujourd'hui, le vent tourne et c'est aux ordinateurs de comprendre l'information sous sa forme humaine, et  la façon dont nous l'utilisons : appels téléphoniques, emails, messagerie instantanée, SMS et bien d'autres. Toutes ces données non-structurées, qui représentent aujourd'hui plus de 80% de l'information d'une entreprise, sont perçues comme des nuances de gris dans le langage en noir et blanc des ordinateurs.

Or se trouver dans l'incapacité de comprendre et d'extraire du sens de ces données peut coûter cher : dans le monde du travail, l'information peut être clé pour la survie et le succès face à la compétition. L'entreprise qui met la main sur l'information cruciale en premier prend une avance compétitive. Mais le volume d'information est tel qu'elles trouvent rarement ce qu'elles cherchaient, à supposer qu'elles savaient déjà quoi chercher...
 
D'après le groupe des analystes IDC, la somme des nouvelles informations digitales créées chaque année devrait être multipliée par 6 à l'horizon 2006-10 pour atteindre un Zettabyte (10 puissance 15 Mégabytes) de données. Cela représente 20 millions de fois le volume d'informations de tous les livres jamais écrits ! Cependant, alors que nous sommes submergés par l'information, la technologie est limitée pour aider à sa compréhension.

Si une première vague de technologies a rendu les données structurées intelligentes, la seconde vague va apporter du sens à toutes les informations, quel qu'en soit le format. Un concept appelé "Meaning Based Computing", permettra aux entreprises de comprendre le sens et le contexte de leurs informations internes, qu'elles aient le format d'un site Internet, d'un document Word, d'un appel téléphonique ou d'un email.
 
Dans le cadre de la compréhension des emails et des autres formes de données non-structurées, la technologie doit faire émerger l'information la plus pertinente, en se basant sur des idées liées par leur contexte et pas seulement par des mots clés. Par exemple, des fraudeurs ne vont pas indiquer le mot-clé "fraude" dans leurs activités ! Il faut donc pouvoir relier automatiquement les informations entre elles par des concepts intrinsèques aux données, et non plus par des informations périphériques - tels que les mots-clés - fournies par la personne. Ce savoir faire a permis par exemple de découvrir les incohérences des activités de Jérôme Kerviel au sein de la Société Générale.
 
Le Meaning Based Computing permet aussi aux salariés de travailler avec plus d'efficacité puisqu'ils ont plus besoin d'interrompre leur rythme de travail. Les salariés perdent ainsi beaucoup de temps à rechercher des informations par mot-clé, alors qu'il serait possible de leur soumettre en temps réel et directement sur leur ordinateur des informations en lien pertinent avec ce qu'ils sont en train de lire, sans distinction de formats.

Un  bon exemple est BAE Systems. La société est typique des très grosses multinationales : elle se bat avec une quantité énorme d'informations internes. Quand elle a découvert que plus de 80% de ses employés travaillant en réseau perdaient 30 minutes par jour à récupérer des informations, et que 60% passaient plus d'une heure à reproduire le travail déjà effectué par d'autres, BAE Systems s'est interrogé sur le lien entre les individus, leur productivité et les technologies de l'information. L'entreprise a découvert que des ingénieurs basés dans deux divisions géographiquement éloignées étaient en fait en train de travailler sur le même problème. Un groupe a trouvé la solution, et a rédigé un "best practice" qui a été soumis a l'autre équipe et a permis de réaliser une économie de plusieurs millions d'euros.
 
Une telle technologie fonctionne également avec les formats les plus récents d'information digitale, telle que la vidéo. France 24, chaine d'information multilingue, a ainsi fait appel à ce genre de solutions pour aider ses documentalistes à retrouver plus facilement et rapidement des extraits vidéo et des archives vraiment pertinents pour les requêtes des journalistes. Dans un environnement ultra réactif et international, cette solution, capable de traiter l'information vidéo en temps réel et sans distinction de langage prend ici encore tout son sens.
 
Le "Meaning Based Computing" prépare la nouvelle phase d'interactions entres les hommes et les ordinateurs, où ces derniers délivreront automatiquement d'eux-mêmes les informations pertinentes sans requête de notre part - ou même sans que nous sachions que chercher comme dans le cas d'enquêtes criminelles ou de contrôles internes de conformité légale.

Ce traitement automatique de l'information améliorera l'efficacité, la productivité et la profitabilité, et signifiera que nous pourrons extraire du savoir de la mer d'informations plutôt que de s'y noyer. L'industrie de la technologie subit une révolution plus importante qu'elle n'en a jamais vécu. Elle ne porte pas sur de nouvelles architectures ou des processus, mais sur un changement fondamental dans la forme de l'information elle-même.
 
Finalement, ce seront les ordinateurs qui s'adapteront à notre monde, et pas l'inverse.