La victoire d’Obama : cas d'étude concret d’utilisation des Big Data

Buzzword qui tourne en boucle pour les uns, argument pour remarketer leur offre pour les autres, la notion de Big Data est complexe et risquerait de paraître repoussante chez les décideurs eu égard aux promesses non-tenues du CRM au regard des investissements consentis dans les années 90’ et 00’.

Cette chronique se propose de donner un exemple concret d’utilisation pertinente et rentable des Big Data en revenant sur le triomphe électoral d’Obama.
Les big data, continuation ou aboutissement du digital par d’autres moyens, est  sujet à controverses… L’histoire de l’élection d’Obama en 2012 nous fournit pourtant un magnifique exemple d’utilisation intelligente des Big Data.

Souvenez-vous : le Web social, Facebook, le message de victoire le plus retweeté de l’histoire… Après la victoire d’Obama, on pensait que tout avait été dit ou presque. L’écume du spectaculaire qui parfois brouille la vision du fond. C’est pourquoi il paraît intéressant de faire un rapide retour en arrière et de se pencher sur la contribution réelle du digital au service de sa réélection alors même qu’il faut se rappeler que la majorité des instituts de sondages* à l’époque, ne l’avaient pas exactement vu venir.
Quel a donc été l'enseignement majeur de ces élections au plan digital ? L'usage massif des réseaux sociaux ? L'utilisation des dispositifs digitaux en mobilité ? L'interrelation du digital avec "la vraie vie" ? La géolocalisation ? La  plupart de ces leviers ont déjà prouvé leur efficacité lors des élections de 2008 notamment en matière de crowdfunding, de buzz et de viralité.

Avec un minimum de recul, il est clair que cette élection a inauguré l'An Un du retraitement de masse de données numériques interconnectées; à savoir l'apparition de la Big Data ** comme levier l'action majeur... appliqué à des élections.
On peut même raisonnablement affirmer que ces élections ont prouvé in vivo la force des big Data.
Pour s'en convaincre, suivez notre raisonnement… 

Marketing politique : l'enjeu de la bascule

En marketing politique, une élection américaine se joue dans la capacité des 2 grands partis à rallier le maximum de votants dans son camp dans l'optique de gagner le plus de Grands Électeurs.
Pour se faire, il s'agit ni plus ni moins que de lancer une grande campagne d'acquisition dont l'objectif est de faire basculer les prospects identifiés en clients i.e. les votants. Notamment dans les Swing States, les états que l’on peut faire basculer plus facilement.
En l'espèce, partant du constat qu'il est plus difficile de faire changer de vote un Républicain convaincu ou un Démocrate militant; il est classiquement admis par les experts électoraux que la victoire se gagne sur une frange d'électeurs indécis communément appelés le "marais" dans le jargon des sondeurs, réservoir de vote estimé autour de 6 à 10% des votants en début de campagne. Cette catégorie permet à elle-seule de faire basculer les élections. Ce réservoir électoral à la marge est donc l'enjeu de toutes les convoitises et de l'essentiel des efforts de conversion des équipes des candidats en lice.
En général l'arsenal pour y arriver sont les meetings (événementiel), les médias (reprises en RP de meetings et publicités), les affiches, les tracts, les réunions et le porte-à-porte au plan local en comptant sur les militants pour colporter "la bonne parole". Jusqu'ici, le digital intervenait à la périphérie de ce dispositif. En renfort : Le digital représentait jusqu'à maintenant un méta-média à tout faire, sorte d’amplificateur de buzz couplé à un outil de connaissance et de mobilisation des électeurs connectés. 

Les Big Data au service de l'action micro-ciblée sur le terrain

Or, cette année, il n'en a pas été ainsi. Le digital, et en particulier le Big Data, ont constitué le cœur du dispositif de campagne d'Obama. 

Comment ? En agrégeant le maximum de données issues d'horizons différents, puis en réinjectant de l'intelligence en les interconnectant dans l'optique d'augmenter le rendement des opérations de recrutement de nouveaux votants. En clair, utiliser de la masse de données au service du micro-ciblage local.
En conjuguant intelligence de la Data, mobilisation sociale locale et mobile via les dispositifs digitaux et actions sur le terrain, les équipes de campagne d'Obama ont prouvé au monde qu'avec peu, on pouvait faire beaucoup. Et ce, avec un effet de levier maximal...à partir de données publiques déjà existantes...

Il suffit pour s'en convaincre de voir le différentiel entre les dernières prévisions de vote données par les sondages quelques jours avant et les résultats réels obtenus lors des élections. 

Le Digital Data Task force d'Obama repose sur 3 piliers de données dont 2 quantitatifs : 

Obama a réussi à s’entourer de jeunes informaticiens venus de Google et de Facebook
Ceux-ci se sont réunis en task force autour d’un projet data reposant sur 3 piliers :

1. Agrégation de données sociodémographiques et nominatives sur une base géographique : disponibles dans le cadre du projet Open Data Gov ;
2.
Corrélations prédictive des votes en fonction de l'historique de résultats électifs précédents par zone géographique : données aussi disponibles publiquement ;
3.
Corrélations avec les sondages d'opinion et les études ad hoc réalisés afin de connaître les thèmes de "bascule" propres à influencer le vote des électeurs indéterminés en fonction des zones d'habitat. Ainsi dans un état traditionnellement conservateur, mettre en avant les arguments Désendettement-Isolationnisme feront plus lever les oreilles que l'évocation du Programme de Santé d’Obama...
En fonction de ce mash-up de données obtenu en interconnectant diverses sources et en les mettant en relation (modèle : bases de données type NoSQL, APIs d'interpolation et de traitement de masse de données) avec à la clé la construction d’un algorithme ad hoc comportant des règles de filtrage territorial, de scoring en fonction des profils de votants-habitants, il devient plus facile aux militants de savoir exactement où et à qui s'adresser, dans quelle maison au sein de quel quartier de tel état, avec quels revenus et quelles préoccupations prédominantes. Bienvenue dans l’ère du Nanotargeting !

La suite logique: le micro-ciblage des électeurs par les militants sur une base territoriale

Grâce à ce dispositif utilisé en mobilité (smartphones et tablettes), la capacité à convaincre et influencer le vote devient plus facile, agile, intelligente qu’une simple opération de marketing téléphonique sans ciblage pertinent et caractère prédictif efficace.
Fort de ce pouvoir de la donnée, les militants des 370 permanences réparties au sein des USA n'ont donc plus eu qu'à déployer une vaste opération de porte-à-porte destinée à faire basculer l'électorat indéterminé en faveur d'Obama. A chaque militant revenait la tâche la plus difficile, celle de "travailler le terrain", de quadriller le dernier kilomètre, celui de l'utilisateur final, en l'espèce l'électeur… en se rendant chez lui. Ainsi donc, tandis que des millions de Dollars étaient engloutis en publicités dans les médias classiques dans l'objectif de soutenir l'image, le message de masse (et la notoriété dans une moindre mesure) sans savoir le réel "retour sur investissement" en terme de basculement de votes, l'emploi massif du Big Data représentait, quant à lui, un véritable outil de conversion à cout contrôlé.

Le digital au secours des entreprises européennes en 2013 ? 

Les enseignements sont évidents. Non pas au plan politique car il paraît peu évident en France d'utiliser les données de telle façon pour les élections… Mais pour les entreprises.
Dans les prochaines années, le digital en général et les big Data en particulier vont prendre une place prépondérante : 

1. en permettant de générer de la croissance à partir de l'existant à cout contrôlé via les nouveaux outils publicitaires comme le retargeting, ce à l'inverse des médias classiques,
2.
en retravaillant les bases de données existantes - ces mines d'or inconnues - avec des appliances faciles à déployer dans le but de trouver les pépites dormantes i.e. les cibles et les segments dormants ayant échappé à la sagacité des marketeurs.
3.
en injectant l'agilité du digital et l'intelligence de la Data à tous les étages-métiers depuis la Business Intelligence jusqu'en support des actions commerciales de terrain comme la campagne d'Obama en témoigne l'efficacité.
4.
en modélisant et en pré-testant les business models disruptifs et les revenues models de dernière génération (en mode itératif type lean start-up) afin de maximiser les chances de réussite des investissements.Nous pensons qu'une utilisation pragmatique et raisonnée du digital et des Big Data constituera le levier générateur de marge crucial pour les entreprises qui l'auront compris avant les autres dans les 5 prochaines années. 

L'enjeu ne tient donc plus à l'opportunité de la transformation digitale -  qui est par ailleurs largement engagée dans de nombreuses organisations - , mais à la capacité des organisations à en tirer rapidement profit, ce, en lui donnant la place stratégique lui revenant. Place qu'elle prendra d'ailleurs inexorablement au sein des entreprises. Gouverner, c'est prévoir. Prévoir c'est anticiper en conjuguant vision et utilisation raisonnée, investissement et recherche de croissance à coût contrôlé.

* Rappelons d'ailleurs que les sondages ne sont que des extrapolations prédictives à partir d'échantillons sociodémographiques représentatifs d'une population redressés en fonction de divers facteurs qui font la force des instituts de sondages.

La force prédictive des sondages partait du constat devenu un classique des statistiques selon lequel la qualité représentative était plus révélatrice que la quantité agrégée de données brutes. La preuve de ce constat avait fait la fortune des instituts de sondages à commencer par Gallup lors des présidentielles de 1936 en utilisant un échantillon de 50 000 répondants s’étant révélé plus pertinent que les méthodes de comptage massif utilisés par le magazine Literary Digest (2 000 000 de réponses à des questionnaires).

** Le Big Data  consiste en la récolte, l'agrégation, l'analyse et le retraitement de masses de données en grand nombre (par croisement, segmentation, scoring et profiling de façon asynchrone, ou, encore mieux, en Real Time) et provenant de diverses sources :

- qu'il s'agisse à l'intérieur de l'entreprise (In the box : bases de données internes liées aux différents métiers du commercial à la BI en passant par les SI),
-
ou à l'extérieur de diverses origines (Out of the box : bases de données publiques, données sociodémographiques et géographique d'instituts, annuaires).

La grande facilité de retraitement permise par les nouvelles générations de base de données de type No SQL et des APIs et langages tels que Hadoop, Map Reduce, langage R) ainsi que les types de services en SaaS et d’appliances émergents (ClikTech…) permettent désormais aux marqueteurs d'accéder et de segmenter de façon itérative et très simple les bases de données sans devoir rentrer dans des schémas de travail complexe passant par la case (SI = Longs développements).
Le Big Data  est couramment utilisé en publicité comme le retargeting (cf Criteo…).
L'intérêt majeur des big Data consiste à pouvoir réaliser du traitement de masse de données, ce qui n'était techniquement et économiquement accessible qu'aux organisations transnationales, ce, il y a encore quelques années.
L'autre intérêt réside dans la capacité induite des BD à retraiter les mines d'or que constituent les bases de données existantes.
En outre, l'interpolation et le co-enrichissement mutuel des bases de données via les BD conduit tout simplement à conférer une valeur ajoutée inédite puisque née des synergies de BDD.

------------------
Pour aller plus loin:

Forbes : http://www.forbes.com/sites/gilpress/2012/12/22/its-your-data-stupid/

MIT: http://www.technologyreview.com/featuredstory/508836/how-obama-used-big-data-to-rally-voters-part-1/

Tous mes remerciements à MM. François-Régis Chaumartin (Proxem.com), Bruno Teboul (Devoteam.fr) et Arnauld-Luc Serraf (ForcoetConsulting.fr) pour avoir eu la gentillesse de relire cette chronique.