« L’Open Data et l‘intégration dans le Cloud » ou l’avenir du Big Data

Les données sont aujourd’hui essentielles dans l’écosystème d’une entreprise. Leur intégration, leur analyse et leur restitution constituent un réel savoir-faire, dont ne disposent pas les DSI.

La question du sourcing se pose donc de façon prégnante. Certaines sociétés proposent déjà dans le Cloud des services « pré-câblés » qui tirent la quintessence de ces données ouvertes à tous. Difficile pour les DSI de concevoir des services en propre et de rivaliser.

Comment définir le Big Data ?

Il s’agit d’un ensemble de données dont la volumétrie et la complexité sont telles que leur gestion exige des moyens organisationnels et techniques nouveaux. Par extension, ces moyens technologiques ou humains extraordinaires sont également appelés « Big Data ».

Des données sont dites complexes lorsqu’elles sont en croissance rapide et soutenue, qu’elles présentent des formats hétérogènes, qu’elles sont peu ou pas structurées (ex : images, vidéos, pages web et emails) ou qu’elles proviennent de sources variées.
Jusqu’à lors peu manipulées (du fait de leur complexité), ces données aujourd’hui analysées permettent de dégager de la valeur pour l’entreprise (analyse de l’attrition sur des processus de vente multi-canaux, calcul de primes d’assurance plus précis en prenant en compte des données de l’Organisation Mondiale de la Santé croisées avec des données qui seront recueillies sur les réseaux sociaux pour identifier des populations à risque, etc.).

Quelles sont les sources d’origine de ces données ?

Ces nouvelles données peuvent provenir de plusieurs sources :

* Toutes les entreprises disposent de données inexploitées car souvent non structurées.
*  Les géants de l’internet (Google, Facebook, grands sites d’achat, etc.) ou les opérateurs téléphoniques disposent également de nombreuses données relatives aux utilisateurs comme par exemple leurs centres d‘intérêts ou leur géolocalisation. Certaines de ces données peuvent être achetées et d’autres sont exploitables gratuitement. Mais pour combien de temps encore ?
*  Enfin, l’Open Data constitue un vivier de nouvelles données à exploiter par les entreprises. Ce nouveau type de données répond à des exigences de transparence (notamment vis-à-vis des pouvoirs publics) et à une volonté de promouvoir un écosystème en libérant l’accès à l’information. Son intérêt réside dans le fait que les données sont fiables, publiées dans des formats qui facilitent leur intégration et libres d’exploitation.

Quelle stratégie d’intégration ?

L’intégration de toutes ces nouvelles données passera très certainement demain par des services hébergés dans le Cloud. Proposés par les géants de l’internet, ces services permettront de croiser les données de l’entreprise avec les données détenues par ces tiers (telles que des catégories de profils construits à partir des données propres aux utilisateurs). Ces données aussi importantes soient elles seront également croisées avec les données de l’Open Data fournies par les états, les services publics ou les organisations gouvernementales.
A priori, ce travail d’intégration et de croisement de tous ces types de données ne sera plus du ressort des entreprises. Seule exception, les entreprises pour lesquelles les technologies de type Big Data sont ou seront utilisées pour augmenter la capacité de calcul d’applications internalisées pour des raisons « stratégiques » (cœur de calcul financier pour des sociétés d’investissement, calcul des risques pour les sociétés d’assurances, etc.).

L’Open Data propose dès lors des données auxquelles l’entreprise n’avait pas accès et contribue ainsi à l’essor du Big Data. Ces données sont aujourd’hui essentielles dans l’écosystème d’une entreprise. Leur intégration, leur analyse et leur restitution constituent un réel savoir-faire, dont ne disposent pas les DSI. La question du sourcing se pose donc de façon prégnante. Certaines sociétés proposent déjà dans le Cloud des services « pré-câblés » qui tirent la quintessence de ces données ouvertes à tous. Il sera donc de plus en plus difficile pour les DSI de concevoir des services en propre et de rivaliser avec ces acteurs qui ont compris les bénéfices de l’ouverture des données et la flexibilité du Cloud…