Statistiques vidéo, poésie ou réalité ?

Comment sont calculées les statistiques vidéo ? La phrase "on peut douter de tout sauf des chiffres" est ici revisitée : quelles sources de données, pour quels usages ?

Statistiques vidéo, quelle éthique ?

Voici pour commencer trois exemples qui posent des questions d’éthique… Pour ne fâcher personne, nous ne citerons pas les plateformes (poids lourds de l’industrie) que ces exemples pourraient concerner.

En réalité, rien n’est plus simple que de détourner le calcul d’audience vidéo à travers une méthode ayant pour résultat d’embellir l’audimat.

Les vidéos que vous regardez dans le back-office de votre logiciel ne devraient pas être prises en compte. Lorsque vous visionnez des contenus en mode créateur, la lecture vidéo ne concerne pas l’audience publique : elle ne devrait donc pas être imputée…

Le rafraîchissement d’une page vidéo ne devrait pas compter un nouveau visionnage. Il s’agit de la même session, du même utilisateur et souvent d’un visionnage furtif qui ne devrait pas être retenu...

Les robots qui visitent cycliquement une page devraient bien être exclus du calcul de visualisation. Pourtant ces agents et moteurs de recherche sont bien souvent pris en compte… De même, une lecture vidéo vue de moins de 5 secondes doit-elle être retenue ?

Ces pratiques peuvent fausser les statistiques d’audience et surévaluer les budgets publicitaires.

Statistiques vidéo, quelle méthodologie ?

A l’ère du big data, les outils et procédures ne manquent pas pour analyser les sources et données. Cet exercice est crucial car les sources de données sont multiples : lecteur vidéo, serveur streaming, serveur Web, page Web…

Ces données ne sont pas redondantes : elles permettent des analyses adaptées.

Selon la méthode de diffusion, une vidéo chargée pourra être lue à nouveau, sans recharger la vidéo. Il se peut même qu’un internaute qui a lu 30 mn d’une vidéo pourra avoir téléchargé l’intégralité de la vidéo (60mn) sans le savoir…

Il est donc indispensable de connaître les données d’audience et les données de chargement pour apprécier l’économie du média.

Le calcul de visiteurs uniques devra également être affiné en comparant les sessions utilisateurs (méthode évoluée) et non seulement les requêtes Web ou numéro IP (méthode basique) qui sont bien moins précises.

Ordre et la méthode : compter précisément requière une méthodologie attentive, des stratégies sans cesse améliorées, sinon le résultat sera incomplet.

Statistiques vidéo, quels aléas ? 

Appréhender les données d’audience requière un peu de recul et de connaissance en statistique. Il n’est pas inutile de rappeler quelques concepts, car toute donnée est soumise à des aléas :

  • Nombre de vidéos vues. Il s’agit du nombre total de vidéos visionnées, mais sans précision du nombre d’internautes qui peuvent avoir lu plusieurs fois la même vidéo.
  • Total des visites. C’est le nombre de visualisations, mais sans précision car un même internaute qui aurait rafraîchi son navigateur, pourra être compté deux fois.
  • Visiteur unique. Le nombre d’internaute, ou plus exactement le nombre de navigateurs connectés car un même internaute peut utiliser plusieurs navigateurs.
  • Vues par visiteur. La moyenne par visiteur unique, mais relative au(x) navigateur(s) utilisé(s) par un même internaute.
  • Nombre de vues par vidéo. Le nombre de visualisation par vidéo (total visites/ nombres de vidéos vues), qui reste toutefois une donnée moyenne soumise à des aléas (méthode de détection des visiteurs uniques, méthode de comptage du nombre de vidéos vues).

La liste n’est pas close. Par exemple, les données de géolocalisation peuvent être influencées par l’architecture du réseau d’entreprise qui peut parfois utiliser des procédés de connexion hébergés dans une autre zone géographique. Etc…

Ce qu’il convient de retenir ? La compréhension des concepts d’analyse est autant nécessaire que de connaître les méthodes de capture pour les adapter selon les cas d’usage.

Statistiques vidéo, quel contexte ? 

Il faut en convenir, les données resteront complexes à interpréter. Même présentées avec de beaux graphiques (camembert, graphe, etc), des fonctions d’export (image, pdf, tableur), des fonctions de tri, l’abondance d’informations reste difficile à appréhender.

Concevoir et améliorer sans cesse des méthodes de suivi statistique est une double peine. Un coût financier constant pour l’éditeur de la plateforme, et des résultats souvent moins vendeurs.

En résumé, deux choix s’opposent : un tableau de bord simpliste (et des traitements minimalistes), un tableau de bord détaillé (et des traitements avancés).

Dans le monde de l’entreprise il est souvent requis d’affiner l’analyse selon plusieurs critères afin de vérifier précisément la pertinence d’une communication, le suivi des apprentissages, les tendances, les thèmes ou adresses consultées.

Depuis l’intranet, un groupe d’utilisateur peut utiliser une adresse IP unique, mais si une connexion SSO est requise il deviendra alors possible de différencier les utilisateurs et déterminer les « visiteurs uniques ». Le contexte d’accès aux médias influe donc beaucoup sur les données d’analyse.

Disposer de filtres pour trier les données suppose aussi de disposer d’une large palette de critères. Par exemple, les critères de « publication » (période de mise en ligne) de « thématique » ou de « canal » (intranet, web, mobile…) permettront une analyse bien plus fine.

Derrière ces outils, de nombreux processus sont mis en œuvre pour rationnaliser les traitements et améliorer sans cesse la pertinence analytique.

Statistiques vidéo, conclusion poétique 

Comprendre les ressorts d’un logiciel (ses algorithmes, sa méthodologie, ses calculs intimes, ses contraintes) est une expertise, les technologies évoluant constamment, ainsi que les usages.

Derrière les courbes et tableaux se tient une démarche logique exigeante, et sinon flatteuse. Et comme tout flatteur vit aux dépens de celui qui l’écoute… Notre conclusion sera poétique.

Un ingénieur, sur son ordi penché,
ordonnait un calcul de nuages.

Un Webmaster, du calcul impétré 
augurait de superbes usages !

Ohé, Cher monsieur l’ingénieur,
notre audience à toute heure s’accroit… je crois…

Nos données chaque jour, sont meilleures.
Quel bonheur nous sommes au zénith, n’est-il pas ?

A ces mots l’ingénieur trahi la chose infuse :
trop heureux d’en expliquer la science…

Mais la méthode devint alors confuse,
altérant quelque peu la confiance.

Les « camemberts » qui paraissaient fameux
devinrent suspects aux yeux du Webmaster.

Ce qui semblait vertueux, devint fumeux, 
et chaque détail possiblement trompeur.

Il jura qu’avant même d’entreprendre
plutôt que croire, ce qui est bien commode,

Pour éviter de se méprendre,
Il faudrait questionner « la méthode ».

Car dans tout logiciel, tout nuage dans le ciel,
réside une logique : un dessein principiel…