Sustenter l’entreprise boulimique de l’analyse des données à grande échelle

Plus la capacité des entreprises à valoriser des données s'accroît, plus leur volonté d’en extraire de précieux indicateurs en quasi temps réel et de découvrir de nouvelles sources à analyser se renforce. Cette difficulté ne disparaitra jamais. Néanmoins, des outils modernes permettent aujourd’hui de comprendre les données et d'apprendre pour une analyse qui devient un outil métier au quotidien.

    

Cadres supérieurs, commerciaux, services marketing, services de relations client, services financiers, services opérationnels, services logistiques... Finalement, presque tous les services des entreprises modernes ont désormais accès à des données toujours plus nombreuses qui leur permettent de bénéficier de précieux avantages concurrentiels, d'améliorer leurs processus métier et d'imaginer de nouvelles applications. 

L'analyse quitte le cercle restreint des data scientists pour devenir un outil métier du quotidien. En fait, elle est devenue tellement courante dans les entreprises modernes qu'elle s'est normalisée. Cette situation n'est pas sans soulever de nouveaux problèmes en termes de développement d'outils et de logiciels d'analyse. En effet, l'objectif consiste aujourd'hui à simplifier et rendre plus intuitives les technologies incroyablement complexes utilisées par un nombre croissant de personnes. L'ergonomie devient peu à peu une caractéristique essentielle, au même titre que l'évolutivité.

 
La puissance de recherche efface la complexité de l’analyse

L'analyse des données, qu'il s’agisse de Big Data ou pas, dépend directement de la puissance de la recherche. Il y a 10 ans, peu d'utilisateurs comprenaient immédiatement le véritable potentiel de la recherche. Toutefois, des technologies open source performantes ont montré que n'importe quel nouveau problème pouvait être résolu par la recherche, ce qui a facilité l'élimination de cet obstacle psychologique. Nous observons d’ailleurs une explosion des cas d'utilisation atypiques et innovants de nos technologies, permettant ainsi aux entreprises d’atteindre un niveau de créativité qu'elles n'auraient jamais imaginé.  

 

Les “Big Data” sont par nature hétérogènes et appellent à une combinaison flexible de recherche plein texte, de recherche structurée et d'analyse. Peu importe que les données soient une page Web classique, un document Word, un lieu via Foursquare, une opération bancaire, un log de serveur Web ou un indicateur quelconque. Tous ces éléments ne sont que des combinaisons de données structurées et non structurées à explorer et parcourir, quels que soient la forme et le volume des données qu'ils renferment. Bien que le contenu des données soit intéressant, les données elles-mêmes n'ont aucune espèce d'importance si la recherche fonctionne.

 

Si nous nous penchons sur les évolutions de l'analyse des données en entreprise au cours des 20 dernières années, nous constatons qu'elles sont majoritairement liées aux progrès en matière de recherche, qui ont donné naissance à de nouvelles utilisations, toujours plus efficaces. Ainsi, il est désormais possible de rechercher des corrélations entre toujours plus de dimensions ou facettes d'un jeu de données, d'effectuer des recherches dans des données non structurées ou dans des volumes toujours plus importants. Certes, les nouvelles technologies d'indexation et de stockage des données ont joué un rôle dans ces tendances, mais elles ont principalement permis de nouvelles formes de recherches, encore plus efficaces.


La recherche moderne dans tous ses états

Les dernières technologies de données, telles que les analyses de graphes et le machine learning ne sont finalement que des applications évoluées de la recherche. Les analyses de graphes permettent à l'utilisateur de rechercher de nouveaux liens entre les données, sans qu'une structure ne soit nécessaire dans le jeu de données concerné. 

Dans un monde dans lequel la technologie offre des possibilités de recherche presque infinies, cette méthode constitue un moyen plus rapide et plus efficace d'explorer les données et de mettre en lumière des tendances et relations importantes. Le graphe fournit une forme de méta-analyse permettant d'identifier les tendances justifiant une analyse approfondie ou une surveillance continue. 

Même le machine learning est basé sur la recherche. Les technologies de recherche sont utilisées depuis longtemps pour étudier le comportement des données au fil du temps et repérer les indicateurs clés d'événements importants. Par exemple, dans les opérations informatiques, l'analyse des logs applicatifs, serveurs et réseaux permet de mettre en lumière des indicateurs annonçant une défaillance imminente.

 

Par le passé, les entreprises demandaient à des spécialistes en données d'établir des modèles statistiques et de définir des seuils pour chaque indicateur identifié. Cette tâche, à la fois complexe et chronophage, entraînait souvent un nombre élevé de faux positifs lors de l'application des modèles à la surveillance des données. Par conséquent, l'analyse comportementale était limitée aux centres de données stratégiques et aux domaines offrant un ROI important, comme le trading. 

Toutefois, le machine learning et les outils d'analyse comportementale, en particulier, montent rapidement en puissance et en capacité. Ainsi, la génération automatique de modèles de machine learning présentant un degré de précision élevé est aujourd'hui accessible. Des outils logiciels peuvent désormais fournir aux entreprises des fonctions d'analyse qui exigeaient il y a seulement 3 ou 4 ans la présence d'une équipe de spécialistes en données et surdiplômés. Cette évolution va permettre la naissance d'applications incroyables axées sur la recherche dans tous les domaines.

Big Data