Project Cortex : le plus ambitieux projet de Microsoft 365 après Teams

Project Cortex : le plus ambitieux projet de Microsoft 365 après Teams Déjà en partie déployé, il met le machine learning à la portée des utilisateurs d'Office. Objectif : équiper la suite d'une couche de knowledge management.

Annoncé par Microsoft lors de son événement Ignite fin 2019, Project Cortex aura pris un an à sortir de terre. Il faut dire que l'initiative est ambitieuse. Cortex est présenté par Microsoft comme "le nouveau service majeur d'Office 365 depuis le lancement de la messagerie d'équipe Teams en 2017". L'ambition ? Recourir à l'intelligence artificielle et au Microsoft Graph pour automatiser le classement et le taggage des contenus Office, quel que soit le format, en recouvrant y compris ceux issus d'autres applications SaaS telles Salesforce. "Cortex extrait des thèmes et informations clés, puis tisse un graph de connaissances basé sur les relations entre sujets, contenus et personnes", explique Seth Patton, general manager de Microsoft 365 (nouveau nom d'Office 365). In fine, l'objectif est d'industrialiser le traitement de documents et, via leur analyse, de détecter les compétences de leurs utilisateurs. En clair, le groupe de Satya Nadella entend capitaliser sur l'IA pour équiper sa suite de productivité d'une couche de knowledge management universelle. 

La première pierre de Cortex a été posée le 1er octobre 2020. Elle se présente sous la forme d'un centre de contenu adossé à la plateforme documentaire de Microsoft 365 (SharePoint). Baptisé SharePoint Syntex, cet environnement permet d'apprendre à l'IA de Cortex comment saisir des informations spécifiques au sein des documents. Nul besoin d'être un data scientist pour l'utiliser. L'outil est à la portée d'un connaisseur d'Excel. "Par exemple, un expert en gestion de contrats peut lui enseigner comment extraire la valeur d'un contrat, sa date d'expiration et ses conditions générales", indique Seth Patton. Sur cette base, le service crée ensuite un modèle de machine learning (ML) en vue d'appliquer cette tâche à d'autres contrats, et ainsi automatiser en masse la conversion des éléments ciblés sous forme de métadonnées. 

Démocratiser la data science via Office

Via Syntex, des modèles de ML peuvent notamment être conçus pour ingérer des formulaires. Exit les processus de GED complexes. Il suffit de soumettre cinq formulaires de même type qui serviront de base d'apprentissage à l'IA. En amont, Syntex détecte automatiquement leurs champs en comparant les formes communes à chacun. Il donne la possibilité d'en ajouter à la souris si certains manquent à l'appel. Après avoir sélectionné les champs souhaités, ne reste plus qu'à entrainer le modèle, puis le tester sur une base plus importante. Si le test est probant, l'application est déployable sous la forme d'un flux de robotic process automation (via la brique PowerApps). Un processus qui pourra par exemple intégrer les données extraites à une application métier, ou encore les convertir en méta data associées au scan du document. 

Syntex permet d'apprendre à Cortex à reconnaitre les champs d'un formulaire ou à identifier des entités (coordonnées géographiques, données marketing, contractuelles, financières...) au sein d'un document. Objectif : les transformer en métadonnées ou les intégrer à une applications de gestion. © JDN / Capture

Mieux encore, Syntex va jusqu'à générer des modèles appliqués à des contenus non-structurés, tels des fichiers (Word, PDF…) ou des e-mails. Dans ce but, Syntex automatise l'extraction d'entités standard : date, heure, code postal, numéro de téléphone, et autres nombres... Il est évidemment possible d'ajouter des entités spécifiques à un métier donné si besoin. A l'instar des formulaires, cinq fichiers d'exemples contenant les entités cibles doivent être soumis en vue d'alimenter le modèle. Plus prosaïquement, on pourra apprendre à Syntex à reconnaitre des documents en vue de les classer. Dans ce cas, la base d'entrainement doit comprendre cinq exemples correctes (fichiers positifs) et cinq exemples incorrectes (fichiers négatifs). 

Au final, les modèles de métadonnées et de classification issus de Cortex viendront enrichir les capacités d'indexation du moteur de recherche de Microsoft 365. Et ce y compris pour les images dont Cortex automatise le taggage sur la base d'un dictionnaire visuel référençant des milliers d'objets. 

Microsoft Graph et Azure Cognitive Services

En coulisse, Project Cortex s'appuie sur le service cloud de NLP (pour natural language processing) de Microsoft : Azure Cognitive Services. Mais également sur la brique de taxonomie de Microsoft 365 lancée en juillet dernier. Accessible via les API du Microsoft Graph, elle est taillée pour gérer les référentiels de classifications et de métadonnées communs à une organisation.

"Cortex va générer des pages contenant des informations comme le résumé d'un projet, les personnes qui y contribuent et des référence annexes"

Pour s'ouvrir aux contenus tiers, Project Cortex bénéficie en outre des connecteurs du Microsoft Graph. Il en existe pour Azure Data Lake et la base de données SQL Server, et pour des applications d'autres fournisseurs (Oracle, Salesforce ou ServiceNow). Enfin, Microsoft a lancé un réseau de partenaires certifiés pour accompagner les entreprises dans la mise en œuvre de Project Cortex. Parmi eux, on relève l'ESN française Devoteam.

Rendre les contenus intelligents

Aux côtés de Syntex, d'autres applications viendront rejoindre la galaxie Cortex d'ici la fin du premier trimestre 2021. Topic experiences est la prochaine sur la liste. En s'appuyant sur l'IA de Cortex et le Microsoft Graph, elle permettra d'identifier ce que l'éditeur américain appelle des "topics" (ou sujets) au sein des contenus Office. "Il s'agit par exemple de savoir-faire, d'expériences de terrain, de clients... Leur validation par un experiences manager aura pour conséquence de générer automatiquement des pages de topics contenant des informations comme le résumé d'un projet, les personnes qui y contribuent et des référence annexes", indique un porte-parole de Microsoft France. A chaque topic mentionné dans un document ou un message sera associé un lien vers la page correspondante (cf. animation ci-dessous). Celle-ci pourra d'ailleurs être enrichie manuellement par les experiences managers.

Via sa brique Topic experiences, Project Cortex générera automatiquement des fiches sur des sujets clés identifiés, tels qu’un projet, un client ou un produit. A chaque mention de ces sujets dans un document ou un message, un lien vers la fiche correspondante sera dynamiquement créé. © Microsoft

Les topics seront évidemment mis en avant dans les résultats de Microsoft Search. En réponse à une requête mentionnant un topic de compétence par exemple, le moteur de recherche de Microsoft 365 renverra vers la liste des collaborateurs disposant de l'expertise recherchée. Dans la même logique, les topics seront intégrés aux pages de profil des utilisateurs de la suite en fonction de leur historique de travail. "L'apport sera un gain de temps d'accès à la donnée et aux connaissances, un onboarding simplifié pour les nouveaux employés, et l'accélération de la transformation de l'organisation globale grâce à des expertises plus visibles", ajoute-t-on chez Microsoft France. 

Faire émerger des synergies

En bout de course, l'utilisateur bénéficiera via Topic experiences d'un knowledge center. Egalement intégré à SharePoint, cet espace lui permettra de suivre l'évolution des savoir-faire sur tout ou partie de son organisation. Mais aussi d'accéder à une liste personnalisée de topics et d'experts internes recommandés en fonction de son activité, de ses propres sujets de prédilection, de son profils de compétences, et de son graph de connaissances et de relations personnel. En parallèle lui seront poussées des questions d'autres collaborateurs auxquelles l'IA de Cortex estime qu'il peut répondre. Via ce knowledge center, il pourra créer de nouveaux topics non-encore identifiés pour dynamiser l'IA de Cortex : nouveaux projets, nouveaux produits, nouveaux clients, nouvelles procédures. 

Topic experiences introduira un knowledge center. Personnalisé pour chaque utilisateur de Microsoft 365, il recommandera une liste de topics et d'experts internes en fonction de l’historique relationnel et de travail. © Microsoft

Avec Project Cortex, Microsoft semble bel et bien vouloir réinventer la digital workplace. Une initiative qui ressemble à s'y méprendre à Delve (certes en beaucoup plus moderne). Une application Office lancée par Microsoft en 2014, mais qui semble depuis être tombée aux oubliettes.

Microsoft aura-t-il plus de chance avec Cortex ? Avec ce nouveau projet, Redmond a le mérite de rester en phase avec sa ligne stratégique : démocratiser l'IA et l'ouvrir au plus grand nombre.  A la différence de Delve, Cortex a par ailleurs fait l'objet d'une phase de bêta privée (de 9 mois). Elle a mobilisé des dizaines de clients de Microsoft parmi lesquels Arla, Robert Half, Siemens Healthineers ou encore Unilever. Une phase qui aura permis à l'éditeur de confronter le concept au marché et de faire des réajustements avant de se jeter dans le bain de la commercialisation.