La collaboration inter-métier, sésame du Big Data !

Comment le Big Data et l’analyse prédictive pourraient-ils prendre la place que tous les analystes leur prédisent dans les entreprises ? Quels sont les freins réels rencontrés ?

Comme tous les directeurs marketing du monde, mon métier consiste à comprendre les attentes et difficultés rencontrées par les clients et clients potentiels de mon entreprise pour mieux adapter notre proposition de valeur.

Dans le monde du Big Data dans lequel j’ai la chance de travailler, les situations que j’observe sont les suivantes :
  • Bien qu’intéressées par les possibilités ouvertes par l’analyse des grands volumes de données, les entreprises peinent à pérenniser les projets qu’elles lancent,
  • En parallèle de ce constat, les entreprises reconnaissent elles-mêmes que les technologies et les outils existent, que les données sont disponibles et que les profils pour les traiter (les fameux data scientists) sont identifiés.

Mais alors, quels sont les freins réels rencontrés ? Comment le Big Data et l’analyse prédictive pourraient-ils prendre la place que tous les analystes leur prédisent dans les entreprises ?

Des outils, des technologies et des données à saisir !
Il est clair que la technologie existe : les outils pour traiter et analyser les grands volumes de données (dit Big Data) sont partout et les entreprises (ou individus) peuvent facilement y accéder (avec, par exemple des outils open source comme Hadoop, MapReduce, Cassandra, MongoDB...).

La donnée, elle aussi,  existe. Aussi bien en interne qu’en externe : la plupart des entreprises aujourd’hui accumulent des montagnes de données qui, si elles étaient traitées et analysées, pourraient se révéler précieuses. Mais les données ouvertes (Open Data) constituent également un trésor informationnel qui ne demande qu’à être analysé.


Enfin, les acteurs existent : partir de la donnée brute et développer des solutions business requiert à la fois une connaissance accrue de son marché, des compétences en analyse de données et en développement. Au quotidien, il faut donc des personnes qui analysent, des développeurs et des décideurs d’entreprises… la plupart des entreprises disposent aujourd’hui de tels profils.


Alors, où est le problème ?

Les projets Big Data sont des projets transversaux !
Le Big Data n’est pas l’affaire d’une seule personne : c’est une erreur assez commune d’imaginer que les data scientists sont les seuls à pouvoir prendre en main un projet de type « Big Data ». A l’échelle d’une entreprise,  la réalité est bien différente ! Pour partir de la donnée brute et arriver à développer une solution exploitable issue de ces données (comme dans le cas de la détection de fraude ou l’optimisation du taux de désabonnement), il faut impliquer de nombreuses compétences différentes. De l’équipe informatique aux gardiens de la donnée, en passant par les data scientists  (qui sont à la fois statisticiens, développeurs, et détectives), les décideurs business et leurs équipes tout le monde peut et doit contribuer au projet global.

Malheureusement, faire travailler ensemble toutes ces personnes est parfois une réelle difficulté. L’une des barrières les plus importantes réside dans la non-communication de ces différents profils.

Des projets transversaux qui doivent passer outre une nouvelle Tour de Babel

Toutes les compétences mentionnées plus haut ne parlent pas exactement le même langage : certains codent en SQL, d’autres en Python, en Pig, en Hive, en R, d'autres en Excel et finalement, nombreux sont ceux qui parlent tout simplement en français ! Pour en rajouter, ces différents langages ont leurs propres batteries d’outils spécifiques. Et, bien évidemment, ces outils spécifiques ne sont pas toujours conçus pour communiquer entre eux efficacement.

Et si le sésame du Big Data était la collaboration inter-métier ?

Comment arriver à faire travailler l’ensemble de ces personnes en équipe et à partager toutes leurs idées, chacune étant issue de leurs compétences spécifiques ?


L’isolation est contre-productive : les entreprises embauchant des « data scientists » au prix fort, elles attendent d’eux qu’ils créent par magie, et tout seuls des solutions business pertinentes dans des temps record. Or, la majorité des étapes nécessaires pour la transformation de la donnée brute en solution prédictive requiert essentiellement la mise en place de  processus transversaux aux différents métiers de l’entreprise… avoir un doctorant en Machine Learning n’est en aucun cas indispensable !


C’est typiquement dans ce genre de cas que des data scientists se retrouvent à passer leur temps  à chercher, trouver et accéder à la bonne donnée, pour ensuite la trier, enrichir et résoudre les conflits de compatibilités entre ces données.  


Pendant tout ce temps, les data scientists ne sont donc pas utilisés à leur plein potentiel et ne se consacrent pas à leur valeur ajouté : l’utilisation de leur compétence en Machine Learning et en Data Science dans le but de créer des applications business générant un fort taux de ROI.

Quand ils doivent montrer leurs résultats (souvent des mois plus tard), des problèmes techniques apparaissent (flux de données cassés, les données travaillées en prototype ne correspondent plus aux données de production…) ou les objectifs business ont déjà changé.

Les projets de l’entreprise restent donc en phase expérimentale, et vont rarement jusqu’à la production, car ils prennent alors bien trop de temps à se mettre en place.

On le voit bien, le problème sous-jacent est la collaboration. En effet, l’acquisition et le traitement efficace d’un grand volume de données est en premier lieu un challenge de collaboration pour l’entreprise.  On parle ici de collaboration entre les personnes (et les compétences associées), les technologies et les données.

Alors comment obtenir une collaboration efficace à tous les niveaux de l’entreprise ? Comment faire en sorte que les personnes non-data scientists soient impliquées dans des projets traitant de problématiques big data ? Comment faire en sorte de porter rapidement une solution d’analyse prédictive jusqu’à la production ? Enfin, comment faire en sorte qu’un projet passe du « data-scientist qui fait tout tout seul » à l’implication de toute une équipe sur un projet d’analyse prédictive ?


Il semble clair que seule la mise en place d’un mode de travail collaboratif qui sera valorisé par l’entreprise pourra accélérer l’adoption des technologies d’analyse prédictive. Quelles solutions avez-vous adopté dans votre entreprise ? Comment pérennisez-vous vos projets de Machine Learning ? Comment valorisez-vous le travail des équipes métiers qui contribuent à la réalisation des solutions business qui assureront le futur de votre entreprise ?

Collaboratif / Acquisition