Collecter et monétiser les données de la maison connectée: pourquoi, comment

Avec l'émergence de la maison connectée de nouvelles sources de données personnelles apparaissent: comment les agréger et les monétiser ? Comment garantir la sécurité des données personnelles ?

Les CNIL européennes ont rappelé à l'ordre Google la semaine dernière concernant son utilisation des données privées sur le Web. En cause notamment la "simplification" de sa gestion des données personnelles, qui permet en fait à Google d'agréger les données personnelles d'un utilisateur sur ses multiples services. Le géant de la recherche est aujourd'hui à même de cibler un utilisateur quel que soit le service visité, en fonction de son historique de recherche, des vidéos visionnées sur Youtube ou de ses informations Google+. De même Facebook pourra à terme effectuer un tel ciblage contextuel grâce aux  données de profil, au graphe social mais aussi à l'historique web grâce aux millions de boutons "Like" et autres plugins sociaux.
L'outil fourni par le site Privacy Choice permet à ce titre d'illustrer le volume de données aggrégées au cours de votre navigation et le niveau de monétisation atteint.

La bataille pour l’agrégation de données personnelles à des fins publicitaires se tourne actuellement vers les smartphones, principalement à travers les applications mobiles. Pour Google cela passe par la diffusion d'Android, de la boutique Google Play, du SDK (kit de développement) publicitaire AdMob et bien sûr par les applications internes Google (Youtube, Maps, ...). Le service Google Now illustre assez bien les possibilités de ciblage contextuel permises par l’agrégation des données utilisateur.
De son coté Facebook peut compter sur sa base installée d'applications, mais également sur les SDK permettant aux développeurs de simplifier l'authentification et la récupération de données provenant du graphe sociale. L'ouverture de l'appcenter et le lancement d'un nouveau format de publicités pour applications la semaine dernière montre la volonté de Facebook d'étendre son influence dans le secteur des applications mobiles et son accès aux données des smartphones.
Venons en maintenant à la maison connectée. L'écosytème n'est bien sûr pas encore aussi développé que sur le web ou le mobile mais il se met en place rapidement. 

Tout d'abord autour de la TV, le principal "écran" de la maison. Selon GfK 28% des téléviseurs vendus en France cette année seront connectables à internet ("Smart TV") tandis que le Broadband forum annonce près de 13 millions d'abonnés à la TV sur IP en France via les  "box TV". Ces évolutions permettent de collecter d'importants volumes de données sur les habitudes de consommation télévisuelle d'un foyer, soit directement soit via des applications "compagnons" installées sur les tablettes ou mobiles des téléspectateurs.
Dans le domaine de la domotique, les opérateurs télécoms multiplient les annonces autour de la maison intelligente: on pourra citer SFR Home ou Bouygues Telecom avec iJenko. Les industriels ne sont pas en reste, que ce soit Somfy ou  Legrand ainsi que certains distributeurs comme Castorama. Dans tous les cas il s'agit de raccorder les équipements domestiques à un boitier central qui permet un pilotage à distance, la récupération de données de fonctionnement (consommation d'énergie) ou l'alerte de l'utilisateur lors d'évènements se produisant à l'intérieur de son foyer.
Enfin de nouveaux objets connectés sont aujourd'hui capables de se connecter directement à Internet : on pourra citer la balance et le babyphone connectés du français Withings; le thermostat sans fil de Nest ou l'aspirateur Cocorobo de Sharp. Avec la généralisation des réseaux domestiques, des smartphones et la baisse des modules embarqués (25$ pour le Raspberry PI, un ordinateur complet) des dizaines d'autres appareils de ce type sont en cours de développement.Tous ces objets proposent des applications mobiles compagnons, des interfaces web de gestion ainsi que des API (interfaces de programmation) permettant notamment aux développeurs de récupérer leurs données de fonctionnement.

TV connectée, centrales domotiques, objets connectés : pourquoi et comment agréger et monétiser toutes les données produites par le foyer connecté?
Le pourquoi tient en un chiffre: selon une étude parue dans le Financial Times, 3 publicités télévisées sur 4 ne sont vues que par 20% de leur audience cible, et ce alors que les annonceurs américains consacrent 42% de leurs budgets publicitaires sur la TV, contre 10% pour les publicités mobiles. La télévision, principal écran du foyer connecté, constitue donc un terreau fertile pour les publicités contextuelles.
Comment ensuite. Grâce à leur omniprésence sur le web et le mobile, et leur appétit de revenus publicitaires, Google et Facebook apparaissent comme les acteurs les plus à même d'exploiter ces données. Soit directement via l'intégration dans les appareils connectés de certaines API ou logiciels proposés par les deux géants: publication directe sur les réseaux sociaux (etc: la TV qui poste l'émission vue, la balance qui poste votre poids), récupération d'informations provenant de leur plateforme (authentification, graphe social, métadonnées) ou implémentation de librairies logicielles pour faciliter la communication entre les objets et la reconnaissance des utilisateurs. Soit indirectement via les applications compagnons mobiles ou web proposes en complément des objets connectés. 
Une fois agrégées les données domestiques pourront être utilisées pour mieux cibler les foyers via les différents écrans présents: télévision connectée (via la publicité insérée dans le flux TV), tablettes ou mobiles (via les applications). 
On perçoit immédiatement les inconvénients de cette approche: la récupération des données n'est pas rémunérée, elle profite seulement aux acteurs en bout de chaîne; les impacts sur la vie privée sont importants, en particulier lorsqu'il s'agit d'objets connectés qui collectent des informations de façon autonome : appelons cela l'effet "Big Brother".

Une approche alternative est de toujours conserver les données à l'intérieur du foyer, de fournir un contrôle complet sur celles-ci et de ne les transmettre qu'à l'initiative des utilisateurs, contre rémunération ou lors d'une transaction. 

Lors de la capture d'une information ("évènement") par un appareil ou plusieurs appareils (ex: visionnage d'une émission sur une TV connecté, contrôle du poids sur une balance WiFi), celle ci est qualifiée via une nomenclature prédéfinie puis diffusée aux autres appareils via le réseau domestique. La nomenclature, véritable langue des objets, est mise à jour régulièrement au cours de la vie des différents appareils.
Ces données sont ensuite agrégées via un ou plusieurs appareils disposant d'un accès à internet permanent (routeur, ordinateur, smartphone) afin de choisir des actions à effectuer en fonction des capacités des autres appareils disponibles dans la maison. Le choix des actions est déterminé à partir de l'évènement détecté, de l'historique des appareils du foyer et d'un flux de règles de ciblage mis à jour en permanence. Ces actions peuvent être effectuées immédiatement ou être programmées.
En temps voulu les actions sont exécutées par un ou plusieurs appareils à l'aide de contenus prédéfinis (clip publicitaire diffusée sur une TV, notification envoyée sur une tablette). L'utilisateur peut alors être amené à effectuer une transaction ou un transfert d'informations volontaire, par exemple accéder au site web de l'annonceur en fournissant les données récoltées par ses appareils.
Cette transaction est alors identifiée par un intermédiaire technique; en remontant la chaîne d'évènements (via les identifiants des appareils) l'intermédiaire est en mesure de rémunérer les différents acteurs ayant permis la transaction finale. Cet intermédiaire est également l'opérateur du système.

Les avantages de ce système sont multiples. Aucune donnée personnelle n'est remontée vers un tiers, sauf autorisation expresse de l'utilisateur. Tous les traitements sont effectuées en local sur la base d'informations régulièrement téléchargées depuis des sources distantes. Le système est prévu pour rémunérer tous les acteurs de la chaîne, depuis le fabricant de l'appareil ayant permis de récolter une information jusqu'à la chaîne de télévision qui a diffusé le clip publicitaire.
Une démonstration de ce système breveté a récemment été effectuée au cours d'un évènement autour de la Google TV, permettant d'afficher des informations contextuelles détectées sur des équipements domotiques Legrand. 

Cependant la mise en place d'un système à grande échelle nécessite l'implication de l'ensemble des acteurs de la  maison connectée: industriels, opérateurs, médias et développeurs d'applications. 

A ce titre le marché français peut servir de laboratoire, en capitalisant sur ses multiples atouts: forte pénétration de la TV sur IP et des réseaux domestiques, présence d'acteurs mondiaux dans le domaine de la domotique et des objets connectés, d'opérateurs télécoms  ambitieux dans ce domaine et chaînes de télévision impliquées sur la TV connectée, mais aussi sensibilité aux problématiques de protection des données personnelles.
C'est dans ce cadre que je publie aujourd'hui cette chronique, sorte d'appel à contribution en direction de l'écosystème français.