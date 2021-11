La start-up française a défini une liste rouge de 40 000 noms de domaine estimés non fiables.

Les sites de désinformation sont en pleine croissance et avec eux… les solutions qui leur font la chasse. Le Français Storyzy en fait partie. La start-up va multiplier ses effectifs par deux cette année, pour atteindre une vingtaine de collaborateurs. Sa solution passe chaque jour le Web au tamis pour détecter la présence d'informations fausses, erronées ou invérifiables. De quoi lui permettre d'établir une liste de près de 40 000 sources estimées non fiables, sur la base de 25 critères de vérification, mais réunissant tout de même une certaine audience (le plancher n'est pas précisé). Une liste que Storyzy enrichit chaque mois grâce à ses crawlers qui sillonnent le web mondial à la recherche d'indices (mots-clés, entités nommées, images, code html, liens entrants et sortants…).

"Si l'algorithme trouve beaucoup des similarités entre un nouveau contenu et notre base de données, on saura qu'il s'agit d'une source ayant une forte probabilité d'être douteuse", explique Pierre-Albert Ruquier, cofondateur et directeur marketing de Storyzy. Ce sont les collaborateurs de l'entreprise qui prennent ensuite la main, pour classer les cas avérés au sein de l'une des huit catégories de la liste rouge. Aucun site n'échappe à leur vigilance. "Même un blog avec au départ une audience limitée peut poser problème si un de ses posts est fortement relayé sur les réseaux sociaux", prévient Pierre-Albert Ruquier. Les noms de domaine concernés sont ensuite disponibles par API ou via un simple fichier. On y retrouve de tout : sites, blogs et autres chaînes YouTube… Propagande pseudo scientifique, incitation à la haine, extrémisme politique, théories conspirationnistes et même des contenus satiriques susceptibles d'être pris au pied de la lettre…

Dans le lot, nombre de sites à l'origine de business douteux. "Il y a plein d'exemples de gens qui profitent allègrement de leurs audiences en vendant des produits et des services autour de concepts fumeux", explique Pierre-Albert Ruquier. La manœuvre est d'autant plus rentable que la majorité de ces sources de fake news passent, en complément, par une voire plusieurs plateformes publicitaires pour monétiser leur audience. Forcément désastreux pour toutes ces marques qui ne peuvent pas se permettre d'avoir leur publicité affichée sur un site défendant des thèses négationnistes ou des théories farfelues sur les liens entre le vaccin contre la Covid et des puces 5G.

Si les marques ne sont hélas souvent même pas au courant que cela se produit, l'actualité des fake news ne semble pas les pousser à se protéger davantage. Sur les 200 grandes marques françaises et internationales qui ont été alertées par Storyzy de la présence de leurs publicités dans ces sites problématiques en France, seules 20% ont souhaité en savoir plus. Aujourd'hui, à peine 20% du chiffre d'affaires de Storyzy vient du secteur de l'achat média. Notamment le groupe de communication GroupM, l'agence 79 ainsi qu'un leader mondial de l'adverification. Storyzy facture tout ce monde via un abonnement mensuel dont le prix varie en fonction du nombre d'utilisateurs qui en bénéficient.

Le reste, et donc l'essentiel des recettes de Storyzy, provient de la plateforme de veille et d'analyse que la start-up a mise au point grâce à sa collaboration en R&D avec le ministère français des Armées. Disponible en libre-service, la plateforme est consultée par nombre de chercheurs, think tanks, ministères français et États, comme la Grande-Bretagne et l'Espagne. Tous les réseaux sociaux sont suivis, des plus populaires, comme TikTok ou Facebook, aux plus confidentiels ou obscurs, comme Telegram ou Gab. Les données fournies permettent de mesurer l'ampleur et cartographier l'action des réseaux de désinformation.

