Business intelligence et analyse de sentiment : comment ça marche ?

Les organisations consomment des quantités colossales de textes numériques. Si les technologies du big data permettent de mieux gérer ces volumes, elles se concentrent la plupart du temps uniquement sur les datas structurées.

Aujourd’hui, les organisations produisent et consomment des quantités colossales de documents et de textes numériques. Si les technologies du big data permettent de mieux gérer ces énormes volumes de données, elles se concentrent la plupart du temps uniquement sur les datas structurées. Or, un texte n’est pas une donnée structurée : pour savoir ce qu’il contient et en extraire l’essence, il faut le lire intégralement. Si c’est un texte de quelques lignes, cela peut être fait manuellement, mais qu’en est-il lorsqu’il faut en traiter des milliers ou des millions ?

Générer automatiquement des métadonnées exploitables

Pour qu’un texte soit exploitable sans avoir besoin de le lire, il convient de le transposer en métadonnées et de ranger ces dernières dans des champs plus manipulables, à la manière de lignes Excel. Tout l’enjeu repose sur la qualité et l’intérêt des métadonnées extraites du texte par des outils appelés annotateurs sémantiques. Leur rôle est de traiter et d'analyser de grandes masses de contenus non structurés pour en tirer les éléments essentiels et les indicateurs clés. Mais, comment cela fonctionne-t-il ?

De qui parle-t-on ? Les entités nommées

Dans un premier temps, il s’agit de détecter les entités nommées afin de savoir de qui l’on parle : une entreprise, une organisation, un lieu, une société, une personne, un événement, un produit etc…

De quoi parle-t-on ? Les concepts

Dans un second temps, il faut extraire les concepts pour connaître le sujet de l’article dans lequel notre entité est citée. Les concepts sont des locutions telles que “politique de santé publique” ou “vague d’attentat”. Il en existe deux sortes : les concepts chauds (dont on parle fréquemment sur le web) et les concepts catégorisés (rangés dans des catégories particulières telles que “économie” “politique” ou “environnement”).

Comment ces informations sont-elles reliées entre elles ?

Ensuite, l’intérêt de l’analyse est d’être en mesure d’établir des relations entre deux entités, reliées par une locution dans une phrase. Cela peut-être une relation de fusion-acquisition entre deux entreprises ou la nomination d’une personne dans une société.

Comment en parle-t-on ? Les sentiments exprimés 

Dans l’immensité du big data, les individus sont des capteurs comme les autres, mais qui diffusent des informations subjectives : on peut de ce fait, apprendre sur eux et notamment les sentiments qu’ils éprouvent. Les annotateurs les plus puissants sont capables de détecter les sentiments exprimés dans une phrase, pour les transformer en trois niveaux de métadonnées. D’abord, en extrayant la nature du sentiment : cela peut être la colère d’un client insatisfait, la joie d’un collaborateur promu, une suggestion d’amélioration émanant d’un consommateur ou même l’intention de désabonnement d’un client mécontent… Ensuite, on observe la force avec laquelle le sentiment est exprimé en la graduant de -3 (très négatif) à +3 (très positif). Et ce, notamment en analysant les adverbes utilisés (“beaucoup”, “très fortement” etc.).Enfin, les annotateurs permettent de connaître le thème sur lequel le capteur s’exprime.

Quels domaines d’application pour l’analyse du sentiment ? La voix du client

Le principal domaine dans lequel il est intéressant de recourir à l’analyse de sentiment est la voix du client, afin de savoir ce que les clients et prospects disent des produits ou de la marque sur internet (forums, réseaux sociaux, blogs…). En effet, en passant la masse de données web à travers un annotateur, il est possible d’extraire tous les sentiments exprimés sur un service, un produit ou une marque. Des technologies sont capables, grâce au machine learning, d’apprendre l’univers sémantique du domaine, d’en extraire des données quantifiées (intensité des sentiments etc.) et ainsi aider à la prédiction (qu’est-ce qui fonctionne aujourd’hui ? Quels produits sont sur la pente descendante ?).

La voix du collaborateur

L’analyse de sentiment est également un excellent outil pour connaître la voix des collaborateurs sur des sujets RH, exprimée spontanément lors des entretiens annuels ou sur les réseaux sociaux d’entreprise par exemple. L’analyse de sentiment soulève ici des enjeux forts car à l’aide des insights, des tendances et de la prédiction, on peut par exemple se prémunir contre les démissions, c’est l’attrition.

La sale intelligence

Il est de plus en plus tendance de coupler les données issues du CRM de l’entreprise aux données d’actualités issues d’un crawl massif du web. Pour cause, en associant ces deux sources d’informations, une entreprise peut pointer du doigt des éléments pertinents qui aideront les commerciaux à adapter leur discours aux attentes de leurs prospects. Par exemple, si l’on sait que l’entreprise cible a ouvert une filiale, les commerciaux pourront se servir de cette information dans leur approche.

Annonces Google