Le neurone et la puce

La curation est un des mots à la mode du moment et recouvre une réalité importante du Web d'aujourd'hui. Faisons le point.

Ah le vilain mot que celui de "curation" ! Il y a décidément des anglicismes qui passent mal. Je ne sais pas pourquoi on ne lui préfère pas le terme d'édition, fût-il imparfait.

Quoi qu'il en soit, c'est depuis quelques mois un des mots à la mode sur le Web et il recouvre quelque chose d'important : essayons donc de remonter du son (bruyant) au sens.

Mais tout d'abord, qu'est-ce que la curation ? J'ai rencontré plusieurs définitions et, plutôt que de trancher, je vais y aller de la mienne, qui vaudra du moins pour cet article. La curation, c'est le fait de détecter, d'organiser et de diffuser de l'information sur un sujet donné.
Autant dire que les humains n'ont pas attendu le Web pour en faire... Sans remonter aux calendes grecques, les revues de presse, les anthologies sont des exemples de curation.

Maintenant, si l'on considère le Web, on comprend aisément pourquoi c'est une notion importante. L'information est une des matières premières du Web et, avec l'avènement des forums, des pages personnelles, du Web 2.0, des CMS et des médias sociaux, celle-ci croît à une vitesse vertigineuse... tandis que nos journées stagnent à 24 heures.

Pour ne parler que du Web moderne, celui qui dans mon esprit commence au milieu des années 1990, deux méthodes de curation se dégagent : l'humaine et l'algorithmique.

La curation humaine, c'est "David and Jerry's Guide to the World Wide Web", à savoir Yahoo!, la start-up californienne emblématique des années 1990. Yahoo! était en effet à ses débuts un annuaire de sites Internet organisé par des personnes selon différentes thématiques. Je me rappelle comme, ayant commencé mon parcours dans le Web en 2001 dans une société de référencement, il fallait proposer manuellement les sites de nos clients et attendre des semaines avant qu'ils ne soient acceptés ou refusés.

Delicious, né durant les années 2000, est une autre start-up qui fit date et, à mon avis, la start-up la plus emblématique du Web 2.0. Grâce à ce site, il est possible de partager ses favoris en ligne et de les classer par mots-clés. Voici par exemple mes favoris au sujet de Google Analytics. Ces favoris, vous pouvez donc les consulter librement et vous y abonner de telle manière à être alerté à chaque nouveau lien. C'est un Yahoo! décentralisé.

Parmi les différentes start-ups du moment dans le domaine de la curation, la plus avancée à mon avis (et elle est française), c'est Pearltrees. Au-delà de l'organisation visuelle et spatiale de l'information (qui est à la main du curateur, et qui donc participe de la curation), le principal saut est la possibilité d'éditer à plusieurs un même sujet. La curation devient un acte collectif. Voyez cet exemple de curation créée par plus de trente curateurs sur le sujet... de la curation.

Le héraut de la curation algorithmique, c'est Google, qui se fait fort de vous donner sur le champ les dix meilleurs liens du Web sur n'importe quel sujet. Pour cela, son algorithme, qui combine plus de deux cents paramètres, est à la recherche de signaux qui vont l'aider à hiérarchiser ses réponses.

Plus généralement, selon le type de service, des critères différents peuvent être pris en compte par les algorithmes. Par exemple, la radio Web Pandora vous recommande des musiques selon votre programmation. L'Edge Rank de Facebook utilise entre autres le nombre d'intéractions et la fraîcheur. Etc.

Il est assez aisé de tracer les principaux avantages et inconvénients de ces deux approches.

La curation humaine, lorsqu'elle est le fait de personnes expertes dans leur domaine, offre une qualité inégalable. Je n'imagine pas de trouver avant plusieurs heures, plusieurs jours peut-être, les liens glanés sur le web design par ce dénommé Shnazz. Elle permet également d'entrer en relation avec d'autres personnes partageant le même centre d'intérêt, la même passion, et de faire même oeuvre de curation commune. En revanche, la curation humaine ne saurait se déployer aussi rapidement et avec autant d'exhausitivité que l'algorithmique. Nombre de sujets ne sont pas traités, ou mal, ou abandonnés, par les services cités plus haut faute de curateurs. Au plan économique, elle est également lourde et coûteuse.

Mais si la curation algorithmique offre une couverture toujours plus étendue et variée pour un faible coût marginal, elle est froide (je n'ai aucune prise sur les paramètres de l'algorithme, que j'ignore le plus souvent, alors que du moins je puis détecter les biais et les parti-pris des personnes), asociale (je suis seul avec mon intérêt, ma passion), sujette au spam (un des principaux mobiles de la mise à jour "Panda" de Google) et elle s'avère peu efficace quand on veut explorer un sujet.

Cela dit, cette façon de présenter la curation selon deux approches antagonistes est surtout didactique. Dans les faits, les deux sont souvent mêlées. Avant Google, les moteurs étaient bêtes à manger du foin. Le coup de génie de Google a été de considérer un lien d'un site vers un autre comme un vote. Or qui fait le lien sinon un humain. Bien des curateurs utilisent Google pour leur recherche.

Et c'est à mon avis la combinaison des deux qui donne les meilleurs résultats. Pandora propose de perfectionner son algorithme en invitant les utilisateurs à noter ses suggestions. Facebook fait de même avec ses publicités. Techmeme emploie des éditeurs pour filtrer la masse d'informations qu'ils collectent par leur moteurs de veille. Netino filtre les commentaires des grands sites d'information d'abord selon des mots-clés (insultes...) puis fait intervenir des personnes. Etc.

Concluons sur une note business. Un des points délicats du modèle économique des services de curation est le fait que, généralement, ils ne sont pas les auteurs du contenu. Aussi, outre les problématiques juridiques, cela fait un acteur de plus à éventuellement rémunérer. Les modèles les plus fréquents sont des modèles publicitaires reposant sur l'audience. Lorsque le service de curation est particulièrement rôdé, le modèle peut également être un modèle de service intégrant notamment en compte dans sa tarification la masse d'informations à curer.