Google SGE : l'IA générative et l'avenir du Search !

L'IA générative est censée réinventer le Search… mais Google SGE n'arrive toujours pas. Quel est l'avenir de l'expérience de recherche ?

Microsoft a lancé Copilot, son moteur de recherche optimisé à l’IA, et Google teste activement sa nouvelle Search Generative Experience. Tout indique que l’IA générative s’apprête à transformer en profondeur l’écosystème du Search. Vraiment ?

L’IA générative promet de réinventer le Search – c’est ainsi que Microsoft présentait son nouveau « copilote pour le web » dès février 2023. Sur le papier, les bénéfices de l’intelligence artificielle sont indéniables : elle écourte le processus de recherche en agrégeant les informations pertinentes depuis de multiples sources, afin de servir une réponse toute prête aux utilisateurs.

Ceux-ci n’ont plus besoin de fournir des efforts pour trier les résultats, explorer les pages, extraire les données appropriées et les combiner sous la forme d’une réponse cohérente autant que satisfaisante. En bref, l’IA générative pourrait bousculer une habitude de recherche digitale bien ancrée depuis le milieu des années 90 – autrement dit, la préhistoire du web.

Microsoft a pris une longueur d’avance sur cette route avec Copilot (ex-Bing Chat), sa déclinaison de Bing boostée à l’IA. De son côté, Google s’apprête à lancer sa Search Generative Experience : une version de la SERP qui propose une réponse générée par l’intelligence artificielle lorsque c’est pertinent. Mais voilà : Google SGE n’est toujours pas là. Au lieu de s’arrêter en d’année 2023 comme prévu, la série de tests menée par la firme de Mountain View se poursuit ; elle s’est même étendue (officieusement) à de nouveaux pays, comme la Roumanie et la Turquie.

Certains voient dans ce retard une preuve que Google SGE ne verra jamais le jour, mais nous y lisons plutôt un manifeste : l’IA générative ne va pas réinventer tout de suite le Search parce qu’elle n’est ni assez performante, ni fiable à 100 %. Et Google en a parfaitement conscience : c’est pourquoi SGE reste pour le moment cantonné aux Google Labs.

Google et l’IA : une longue histoire

Notre idée est la suivante : la décision de Google de prolonger les tests s’inscrit pleinement dans sa politique concernant l’implémentation de l’intelligence artificielle dans ses outils.

Depuis près de dix ans, l’IA joue un rôle majeur dans l’algorithme du moteur de recherche – mais un rôle confidentiel, incarné dans les coulisses plutôt que sur le devant de la scène.

Pour la plupart d’entre eux, les internautes ne soupçonnent même pas que l’IA dicte en partie la liste des résultats de recherche depuis 2015 et RankBrain, une mise à jour (à base de deep learning) conçue pour aider l’algorithme à mieux comprendre les requêtes complexes exprimées en langage naturel. BERT en 2019, puis MUM en 2021 ont poussé l’algorithme plus avant dans cette même voie, avec un objectif unique : améliorer la SERP en analysant au plus près les demandes des utilisateurs.

En somme, l’IA est là, bien présente, et depuis longtemps. Mais elle l’est en pointillé, invisible et indétectable. Alors que Google n’était pas encore le mastodonte que l’on sait, l’un de ses fondateurs, Larry Page, remarquait que « le moteur de recherche parfait devrait comprendre exactement ce que vous voulez dire et vous fournir précisément les réponses dont vous avez besoin ». C’est spécifiquement la direction privilégiée encore aujourd’hui par le moteur, et la motivation principale qui concourt à l’intégration de nouvelles fonctionnalités.

Quelle conclusion en tirer ? Que Google, jusqu’à présent, a préféré laisser l’intelligence artificielle à l’arrière-plan, à la manière d’un mécanisme indispensable mais imperceptible. Et sans doute, cette démarche n’aurait pas changé d’un iota sans le coup d’éclat d’OpenIA avec ChatGPT, la découverte consécutive des grands modèles de langage (LLM) par le public, et l’empressement de Microsoft à intégrer le chatbot dans son moteur Bing.

En substance, Google ne pouvait pas ne pas réagir. La firme a annoncé Bard, puis lancé des tests sur Google SGE… mais sous la contrainte et, d’une certaine façon, pour une question d’image de marque. C’est important de le comprendre pour aller au bout de cette affaire.

L’expérience de Copilot (ex-Bing Chat)

Alors, pourquoi Google SGE est-il encore confiné aux laboratoires de recherche et développement d’Alphabet ? Pour tâcher de répondre à cette question, il faut faire un détour par Bing et par son IA générative, Copilot, accessible au grand public depuis plusieurs mois. En effet, Microsoft a fait le choix d’intégrer directement l’intelligence artificielle dans son interface de recherche afin de proposer aux internautes une expérience hybride, qui combine SERP traditionnelle et utilisation frontale de l’IA.

Sauf que l’expérience de Copilot suggère que l’IA générative n’est ni aussi performante, ni aussi pertinente qu’attendu. D’abord, il n’y a pas eu de migration massive des utilisateurs de Google vers Bing : les statistiques montrent que le moteur de Microsoft a gagné moins de 1 % de parts de marché depuis le lancement de Bing Chat, selon SEO Round Table – pas de quoi faire trembler Alphabet sur son piédestal. (Même l’expansion de l’utilisation de TikTok comme moteur de recherche par la génération Z n’a pas fondamentalement modifié la place occupée par Google dans l’écosystème du Search.)

Conséquence : les utilisateurs ne changeant pas d’habitudes de recherche et restant massivement sur Google, la firme n’a aucune pression pour sortir Google SGE au plus vite.

Ensuite, et surtout, les utilisateurs ont tendance à trouver Copilot moins utile et moins fiable que ChatGPT et Bard, en raison de réponses de moindre qualité et d’une interface globalement mal pensée et peu intuitive. C’est ce que montre une étude menée par le Nielsen Norman Group au sujet des trois IA génératives du moment.

(Source : NN Group)

Ces résultats médiocres s’expliquent par le fait que Copilot échoue à proposer une réponse réellement pertinente à la requête formulée. Les utilisateurs constatent que l’outil les renvoie régulièrement vers des pages web à consulter par eux-mêmes, et qu’il leur incombe de combiner les bouts d’information pour en tirer une réponse concrète et pertinente – ce qui en revient à proposer la même chose qu’une SERP classique.

Plus globalement, les internautes interrogés dans cette étude ont senti que les réponses affichées par l’IA de Bing étaient de moindre qualité que celles d’un moteur de recherche traditionnel.

Les limites de l’IA générative

Ce qu’il faut retenir de l’expérience à grande échelle menée par Microsoft avec Copilot, c’est que l’IA générative n’est pas tout à fait prête à changer la donne. Et c’est précisément la raison pour laquelle Google SGE est sans doute amené à rester dans les laboratoires encore quelque temps : il n’est pas question de lancer une technologique qui n’a pas fait la preuve de son efficacité et de sa fiabilité. Or, à ce jour, l’IA générative ne remplit aucun de ces deux préalables – et c’est tout aussi vrai pour la Search Generative Experience.

Avant de pouvoir mettre l’intelligence artificielle sur le devant de la scène du Search, deux problématiques essentielles doivent être solutionnées afin d’offrir aux utilisateurs une expérience réellement qualitative.

D’une part, en tant que système de recherche d’information, les grands modèles de langage sont difficilement exploitables. Pour le comprendre, il faut aller regarder du côté du fonctionnement de l’algorithme classique : le processus d’intégration des nouvelles pages dans l’index est fluide et continu, ce qui signifie qu’un contenu nouveau (ou mis à jour) est ajouté chaque fois que les robots d’indexation tombent dessus, et que l’index est actualisé aussi régulièrement que nécessaire. Cette fluidité est incontournable dans la mesure où l’ajout de contenus est susceptible de changer les relations qui existent entre les différentes pages comprises dans l’index.

Mais un LLM ne marche pas du tout de la même manière. Pour faire (très) simple, il s’agit d’un programme tout d’un bloc qu’il faut « entraîner » à nouveau pour pouvoir intégrer des données à chaque modification du corpus. À défaut, l’ajout d’un contenu qui modifie ou réfute un contenu précédent peut avoir un impact imprévisible sur le comportement du programme. Les LLM ne sont pas prévus pour fonctionner comme des index souples dans lesquelles des informations nouvelles sont injectées en continu. D’une certaine manière, cela signifie que l’IA générative est « rigide » et qu’il est très difficile de lui enseigner de nouvelles choses. Un problème loin d’être résolu à ce jour, et pourtant crucial pour un outil censé pouvoir apporter des réponses fraîches et toujours pertinentes.

D’autre part, l’IA générative montre des problèmes de fiabilité. Elle a tendance à rapporter de fausses informations et à commettre des erreurs, que l’on appelle (à tort ou à raison) des « hallucinations ». Les exemples abondent à propos de Copilot, qui non content d’ignorer parfois les bonnes réponses, va jusqu’à inventer des informations de toutes pièces – par exemple, en créant des controverses à propos de candidats à des élections (voir l’étude de AI Forensics à ce sujet).

Ce n’est pas un souci mineur : tous les acteurs de l’industrie travaillent à doter l’IA générative d’outils d’auto-vérification afin de lui permettre de contrôler la justesse de ses affirmations. Dans la mesure où le Search dopé à l’IA est censé afficher une réponse unique (certes soutenue par des sources, mais qui restent facultatives), il est crucial que celle-ci soit claire, transparente, pertinente et indiscutable, dans la limite des connaissances du programme à l’instant T. Pour le moment, toutefois, la machine est condamnée à halluciner de temps en temps – avec des conséquences potentielles majeures.

Il existe également des plateformes de rédaction de contenu comme Senek alliant humain et IA afin d'obtenir le meilleur des deux mondes. Il y a de fortes chances que l'on voit les demandes exploser sur ce genre de besoins avec des tarifs préférentiels.

Google SGE : une fonctionnalité destinée à rester à l’arrière-plan ?

Tout cela nous ramène à Google SGE et à une phase de test qui pourrait bien s’allonger encore… jusqu’à ce que l’entreprise soit assurée de proposer une expérience de recherche parfaitement convaincante. Rien ne serait pire que de lancer un outil dont le fonctionnement laisse à désirer (on se souvient des couacs de Bard lors de sa présentation surprise – et certainement en partie improvisée – en début d’année 2023). De fait, dans sa forme actuelle, SGE ne peut sans doute pas devenir la nouvelle version du Search. Ce qui explique son retard.

En guise de conclusion, voici quelques hypothèses concernant Google SGE :

La Search Generative Experience était essentiellement une réponse défensive de la part de Google face au succès fulgurant de ChatGPT et aux projets de Microsoft de l’intégrer au plus vite dans Bing. En ce sens, Google SGE a surtout servi de levier médiatique, une façon pour la firme de reprendre l’avantage sur ses concurrents en matière d’attention. Le fait que l’on parle énormément de cette fonctionnalité prouve que l’opération de communication n’est pas restée vaine.
Google est concurrencé par un nombre grandissant de services ou de plateformes existantes dont les usages évoluent (Bing avec Copilot, TikTok qui sert de moteur de recherche pour les jeunes utilisateurs). Mais faute de réelle alternative à ce jour, le moteur a toutes les chances de rester dominant encore longtemps. Il n’y a donc pas d’urgence à lancer un nouvel outil qui n’est pas 100 % prêt : tant que les utilisateurs sont présents, la technologie peut tranquillement mûrir dans les coulisses.
Nous avons peu de chances de voir Google SGE sous la forme qu’on lui connaît actuellement – la forme sur laquelle la firme communique beaucoup. Il est possible qu’au fil du temps Google choisisse de se stabiliser sur une version « light » de son IA générative qui resterait plutôt à l’arrière-plan du processus de recherche. De fait, l’état de l’intelligence artificielle suggère que cette technologie est plus efficiente comme pilier supportant les fonctionnalités principales du moteur de recherche que comme interface propre. Selon les termes de Ross Hudgens, CEO de Siege Media, Google SGE se présente comme « un terrain fertile sur lequel se développeront les nouvelles fonctionnalités de la SERP, plutôt qu’une interface globale et unique telle que Google nous l’a montrée ».

Nul ne sait quand Google SGE sortira enfin des Google Labs. Mais la forme que prendra la Search Generative Experience à ce moment-là pourrait bien nous surprendre.