« L’Open Data et l‘intégration dans le Cloud » ou l’avenir du Big Data
Les données sont aujourd’hui essentielles dans l’écosystème d’une entreprise. Leur intégration, leur analyse et leur restitution constituent un réel savoir-faire, dont ne disposent pas les DSI.
La question du sourcing se pose donc de façon prégnante. Certaines sociétés proposent déjà dans le Cloud des services « pré-câblés » qui tirent la quintessence de ces données ouvertes à tous. Difficile pour les DSI de concevoir des services en propre et de rivaliser.Comment définir le Big Data ?
Il s’agit d’un ensemble de données dont la volumétrie et la complexité sont telles que leur gestion exige des moyens organisationnels et techniques nouveaux. Par extension, ces moyens technologiques ou humains extraordinaires sont également appelés « Big Data ».
Des données sont dites complexes
lorsqu’elles sont en croissance rapide et soutenue, qu’elles présentent des
formats hétérogènes, qu’elles sont peu ou pas structurées (ex : images,
vidéos, pages web et emails) ou qu’elles proviennent de sources variées.
Jusqu’à lors peu manipulées (du
fait de leur complexité), ces données aujourd’hui analysées permettent de
dégager de la valeur pour l’entreprise (analyse de l’attrition sur des
processus de vente multi-canaux, calcul de primes d’assurance plus précis en
prenant en compte des données de l’Organisation Mondiale de la Santé croisées
avec des données qui seront recueillies sur les réseaux sociaux pour identifier
des populations à risque, etc.).
Quelles sont les sources d’origine de ces données ?
Ces nouvelles données peuvent provenir de plusieurs sources :
* Toutes
les entreprises disposent de données inexploitées car souvent non structurées.
* Les géants
de l’internet (Google, Facebook, grands sites d’achat, etc.) ou les opérateurs
téléphoniques disposent également de nombreuses données relatives aux
utilisateurs comme par exemple leurs centres d‘intérêts ou leur géolocalisation.
Certaines de ces données peuvent être achetées et d’autres sont exploitables
gratuitement. Mais pour combien de temps encore ?
* Enfin,
l’Open Data constitue un vivier de nouvelles données à exploiter par les
entreprises. Ce nouveau type de données répond à des exigences de transparence
(notamment vis-à-vis des pouvoirs publics) et à une volonté de promouvoir un
écosystème en libérant l’accès à l’information. Son intérêt réside dans le fait
que les données sont fiables, publiées dans des formats qui facilitent leur
intégration et libres d’exploitation.
Quelle stratégie d’intégration ?
L’intégration de toutes ces
nouvelles données passera très certainement demain par des services hébergés
dans le Cloud. Proposés par les géants de l’internet, ces services permettront
de croiser les données de l’entreprise avec les données détenues par ces tiers
(telles que des catégories de profils construits à partir des données propres
aux utilisateurs). Ces données aussi importantes soient elles seront également
croisées avec les données de l’Open Data fournies par les états, les services
publics ou les organisations gouvernementales.
A priori, ce travail d’intégration
et de croisement de tous ces types de données ne sera plus du ressort des
entreprises. Seule exception, les entreprises pour lesquelles les technologies
de type Big Data sont ou seront utilisées pour augmenter la capacité de calcul d’applications
internalisées pour des raisons « stratégiques » (cœur de calcul
financier pour des sociétés d’investissement, calcul des risques pour les
sociétés d’assurances, etc.).
L’Open Data propose dès lors des données auxquelles l’entreprise n’avait pas accès et contribue ainsi à l’essor du Big Data. Ces données sont aujourd’hui essentielles dans l’écosystème d’une entreprise. Leur intégration, leur analyse et leur restitution constituent un réel savoir-faire, dont ne disposent pas les DSI. La question du sourcing se pose donc de façon prégnante. Certaines sociétés proposent déjà dans le Cloud des services « pré-câblés » qui tirent la quintessence de ces données ouvertes à tous. Il sera donc de plus en plus difficile pour les DSI de concevoir des services en propre et de rivaliser avec ces acteurs qui ont compris les bénéfices de l’ouverture des données et la flexibilité du Cloud…