« Big Data » : il faudra certes de l'innovation mais surtout un vrai sens de l'adaptation

Les entreprises consommatrices de technologies observent, évaluent, s’interrogent sur la pertinence de chaque innovation significative. L’innovation est-elle une opportunité ou un risque ? Et comment intégrer de nouveaux composants dans les systèmes en place ?

Plutôt que de décliner une nouvelle définition du concept, je peux constater simplement qu’il y a un nouveau mot-clé majeur, un nouveau concept et de nouvelles solutions, qui renvoient tous les fournisseurs à leurs obligations d’innovation et d‘évolution permanentes.
Les entreprises consommatrices de technologies observent, évaluent, s’interrogent sur la pertinence de chaque innovation significative. L’innovation est elle une opportunité ou un risque ? Comment intégrer de nouveaux composants dans les systèmes en place ? Quelle valeur et à quelle échéance ?

Évolution permanente ou rupture technologique ? La croissance des volumes, les délais d’accès à l’information, la variété des sources d’informations ne sont pas des nouveautés à proprement parler mais il y a bien de nouvelles façons d’aborder ces enjeux. Ces nouvelles réponses marquent elles une rupture, une frontière ? Non, car cela voudrait dire qu’il n’y pas eu d’innovation depuis un moment et qu’aucune de ces tendances n’a été identifiée ou anticipée.
La gestion et l’analyse des données sont des domaines en pleine ébullition et depuis plusieurs années, l’arrivée de nouveaux acteurs, la percée de nouveaux produits et même les rachats d’entreprises établies font partie des symptômes de cette agitation. La Business Intelligence est devenue un domaine de spécialité à part entière dans la gestion de l’information et est aussi une discipline multiformes pour laquelle le terme classique de ‘BI’ ne suffit plus.
Multiformes, parce que les données structurées issues des systèmes opérationnelles ne suffisent plus. Multiformes, car il faut traiter indifféremment les besoins spécifiques de chaque département comme une vision consolidée au niveau de l’entreprise. Multiformes parce qu’il faut se soucier de ce qui est en train de se passer, de ce qui va se passer et de ce qui s’est passé il y a quelques heures, semaines, ou années. Aujourd’hui, il faut intégrer les informations produites par les hommes comme les données produites par les machines. Il faut fournir une information intelligible dans l’entreprise comme vers l’extérieur. Il faut aussi fournir des capacités nouvelles d’exploration des données aux personnes qui sauront y découvrir des informations utiles.
Et nous pourrions allonger ainsi longtemps la liste des sources d’informations, la liste des types d’informations, la liste des profils de consommateur de ces informations, la liste des exigences des uns et des autres. Pour notre part, nous parlons aujourd’hui du « décisionnel pour tous » .
Des solutions à la fois plus complètes et plus spécifiques
Les acteurs et fournisseurs de ce marché agissent et réagissent en continu face à ces évolutions. Les  grands éditeurs s’orientent vers des réponses plus larges, plus complètes, mieux intégrées et les spécialistes,  nouveaux acteurs ou bien établis, vont vers des approches mieux ciblées et plus spécialisées.
Pour l’infrastructure de gestion des données, il convient d'innover pour  « repousser les murs », perfectionner les solutions, les rendre plus rapides, meilleur marché et moins « encombrantes », tout en augmentant leurs capacités. Les fournisseurs informatiques ont amélioré l’ensemble des composants matériels, de la puissance des processeurs aux capacités mémoires. Le logiciel et les bases de données en particulier exploitent ces nouvelles capacités avec le stockage en colonne, la compression, le parallélisme et plus récemment le « in-memory ».
Une très large part des réponses spécifiques au concept « big data » sont des solutions centrées sur la distribution de données et les traitements massivement parallèles. Mais, à nouveau, il y a bien d’autres voies pour exploiter des données à grande ou moins grande échelle. Et comme souvent, alors qu’on veut opposer les technologies existantes aux dernières innovations, la vraie réponse est certainement dans la complémentarité des approches.
Cosmcore est une entreprise cliente de technologies dites « Big Data ». Leader mondial de la mesure d’audience sur Internet, Comscore manipule en continu, de par son activité de fournisseur d'informations comportementales, énormément de données de formats brutes dites ‘non structurées’. Pour les gérer, Comscore utilise des technologies dites «Big Data», notamment un framework  Hadoop MapReduce. Mais il ne fait pas tout avec cette technologie. Les importants volumes de données brutes ainsi traités lors de cette première étape sont ensuite basculés sous une forme structurée, dans des systèmes de bases de données dotés de capacités de stockage en colonne et de parallélisation des traitements pour y opérer des analyses complexes, le cœur de son activité.
A la diversité des besoins correspond une véritable diversité de solutions, la vague « Big Data » nous donne l’occasion de fixer notre attention sur l’infrastructure de gestion des données et c’est donc l’opportunité de revoir tous les choix possibles, de s’interroger sur les véritables besoins et de remettre en perspective les bonnes pratiques.


Big Data