Google Maps roule à l'IA pour optimiser la navigation

Google Maps roule à l'IA pour optimiser la navigation Le service cartographique s'adosse à la vision par ordinateur pour localiser ses utilisateurs et bâtir son référentiel d'adresses.

"L'un des défis constants de Google Maps consiste à déterminer la bonne direction à suivre", lance Tilman Reinhardt‎, ingénieur logiciel chez Google. "Au fil des années, nous n'avons eu de cesse d'améliorer la précision de sa boussole numérique, aussi bien grâce aux GPS qu'aux compas magnétiques (intégrés aux smartphones, ndlr). Mais nous avons été obligés de nous rendre à l'évidence : ces solutions souffrent de limitations en milieu urbain" Ainsi, l'alignement des immeubles réfléchit le signal GPS par effet miroir. Résultat : un manque de précision... qui va jusqu'à positionner l'appareil dans le mauvais sens de circulation voire à quelques blocs de son emplacement réel. Autre problématique, le GPS ne détermine que la localisation mais pas l'orientation. Capable théoriquement de jouer ce rôle, le compas magnétique échoue lui-aussi, les sources d'interférence étant trop nombreuses en ville (fils électriques, wifi, réseaux mobiles…). "D'où l'idée de faire appel à l'intelligence artificielle appliquée à la reconnaissance d'images pour dépasser ces difficultés", précise Tilman Reinhardt.

Pour dépasser la limitation du GPS en ville, Google Maps combine imagerie directe et machine learning pour cerner plus précisément la localisation d’un smartphone. Des panneaux d’indication en réalité augmentée apparaissent pour guider l’utilisateur. © Google

Google teste ainsi le recourt à la vidéo comme alternative au signal GPS pour déterminer une localisation. La technologie en question, baptisée en interne Visual Positioning Service (VPS), consiste à combiner une vidéo prise par l'utilisateur de son environnement d'une part, avec le plan Google Maps correspondant d'autre part, ce dernier apparaissant en réalité augmentée en bas d'écran (voir animation ci-dessus). En cernant des points de repère sur les images vidéo (contours de monuments, d'immeubles, de ponts…), le VPS calcule par triangulation des points géographiques et les stocke dans un référentiel. Il compare ensuite les nouvelles vidéos prises par les internautes avec cette base de données cartographique pour affiner leur localisation. Problème : la précision du système dépend de la qualité des clichés pris sur les smartphones… Pour résoudre l'équation, Google complète le dispositif avec Google Street View. Recouvrant des milliards de points de référence dans près de 100 pays, le service de navigation visuelle permet de valider et affiner les triangulations.

Machine learning et deep learning

Une marge d'erreur demeure néanmoins. Les images collectées par les téléphones peuvent en effet différer de celles de Google Street View, la Google Car les ayant potentiellement captées à des périodes différentes. Or, en fonction de la saison, les végétaux (arbres, haies…) n'offrent pas la même silhouette. En hiver, certains n'ont plus de feuilles, d'autres ont pu être élagués ou coupés. Sans compter la présence éventuelle de travaux sur la voirie, par définition temporaire. D'où la nécessité pour Google de sélectionner uniquement les éléments permanents du paysage urbain en vue de réussir ses triangulations. Pour répondre à ce défi, les équipes de Google ont conçu un modèle de machine learning pour identifier les composants graphiques éphémères, en vue de se limiter aux invariants. La vision par ordinateur prend forme (lire le post officiel pour plus d'informations).

Pour calculer une position, Google Maps procède par triangulation. Le machine learning lui permet d’éliminer les points de repère temporaires (végétations, travaux...). © Google

Evidemment, Google Maps fait appel à l'IA dans d'autres domaines. Le service s'appuie par exemple sur un modèle de réseaux de neurones pour intégrer les noms de rues. Des données là-encore issues de Google Street View. Dans cette optique, Google a créé en 2016 une base d'entrainement reposant sur un référentiel français. Baptisé French Street Name Signs (FSNS), il répertorie 1 million de noms de rues basées dans l'Hexagone. Objectif : améliorer le système d'OCR (optical character recognition) qui était utilisé jusqu'ici par le groupe, y compris dans d'autres pays. En se basant sur ce modèle de deep learning tout en combinant l'analyse de plusieurs plaques d'une même rue, l'algorithme permet de résoudre les distorsions, les flous directionnels, voire d'identifier les éléments perturbateurs, tels que les affiches sauvages gênant la lecture des numéros de rue captés par la Google Car.

"Via notre algorithme de reconnaissance de noms de rue, nous avons constaté un taux d'erreur de 15,8%. Cependant après analyse de ces cas d'échec, nous avons découvert que 48% d'entre eux s'expliquaient par des erreurs de marquage. Ce qui ne remettait donc pas en cause la validité de notre modèle", précise Julian Ibarz, ingénieur logiciel chez Google (lire le dossier de recherche de Google).

La Street View car pour décoder les adresses

Associé au dispositif d'extraction des numéros de rue, le nouveau système de digital image processing a permis à Google Maps de nourrir son annuaire d'adresses. "Désormais, quel que soit l'endroit où passe la Street View car, nous sommes capables d'analyser les dizaines de milliers d'images capturées, en extraire le nom des rues et leurs numéros, et ainsi créer et localiser automatiquement de nouvelle adresses sur Google Maps", résume Julian Ibarz.

Exemple de normalisation de plaques de rue au Brésil. Ici, l’algorithme a converti “AV” en "Avenida” et “Pres.” en “President". © Google

Pour compléter l'édifice, Google inclut à Google Maps la reconnaissance d'enseignes commerciales depuis 2015. Après avoir publié une note de recherche sur le sujet, le groupe décide de réutiliser son modèle de deep learning conçu pour décrypter les noms de rues. L'algorithme lui permet d'isoler uniquement le nom commercial des enseignes. Une manière pour l'entreprise de Mountain View de donner de la visibilité aux marques sur Google Maps, avec à la clé une offre publicitaire supplémentaire.

A lire aussi