Les petits (et grands) secrets d'OpenAI bientôt révélés

La Federal Trade Commission, ou FTC, a ouvert une enquête sur le créateur de ChatGPT. Et le degré de précision de ses questions, que ce soit sur ses finances ou sa techno, en dit long sur les soupçons de l'administration américaine.

OpenAI bientôt sanctionné par la Commission fédérale du commerce (FTC) ? La start-up fondée par Sam Altman fait l'objet d'une enquête du gendarme américain. Au cours de la semaine du 10 juillet, il lui a adressé une demande d'informations complémentaires, selon un document consulté par le Washington Post. L'enquête se concentre sur deux griefs : le premier porte sur une violation présumée de la protection des données personnelles des consommateurs, le deuxième sur des informations trompeuses voire calomnieuses parfois générées par ChatGPT.

Hallucination et fuite de données

La FTC s'intéresse plus particulièrement à une fuite de données confidentielles sur ChatGPT intervenue le 20 mars 2023. Pendant quelques heures, certains utilisateurs ont pu consulter, le nom, le prénom, l'adresse mail, l'adresse de facturation, les quatre derniers chiffres du numéro de carte bancaire, et la date d'expiration de plusieurs clients. La FTC cherche maintenant à savoir si les pratiques de sécurité de l'entreprise sont conformes aux lois sur la protection des consommateurs.

En parallèle, l'agence américaine demande à OpenAI de fournir des descriptions détaillées de l'ensemble des plaintes reçues au sujet d'informations "fausses, trompeuses, diffamatoires ou préjudiciables" générées par ChatGPT. L'enquête se porte en réalité sur le principal biais de l'IA, l'hallucination. La FTC cherche à savoir si les propos du chatbot ont pu porter "préjudice à la réputation" des consommateurs.

Financement et questions techniques

En parallèle et selon le document, la Federal Trade Commission tente de clarifier le mode de financement de l'entreprise. OpenAI doit notamment lister l'ensemble des actionnaires de l'entreprise détenant au moins 5% de parts. La start-up est également invitée à décrire son mode de financement et ses objectifs financiers. Côté technique, la FTC veut comprendre comment les modèles d'OpenAI ont été entraînés ces dernières années. L'origine des données, la méthode d'obtention, la classification (par étiquettes) et sa répartition, le procédé des sélections des sources et le pourcentage de données textuelles par langue sont notamment demandés à la start-up.

Dans sa requête, la FTC exige également d'OpenAI qu'elle lui décrive avec précision les politiques de sécurité et procédures mises en place avant la publication de ses modèles de langage, y compris les dernières itérations des modèles historiques. Par cette demande, l'agence tente de savoir si OpenAI a mis en œuvre des garde-fous pour limiter au minimum les risques pour les utilisateurs finaux. Cette procédure permet à la FTC d'évaluer le degré de responsabilité d'OpenAI relatif aux griefs exprimés. Plusieurs biais bien connus des experts en IA, à l'image de l'hallucination et l'injection par prompt, sont questionnés, tout comme leur récurrence.

Enfin plus classiquement, le gendarme du commerce s'intéresse au traitement des données personnelles. Pour chaque produit commercialisé, OpenAI est invité à préciser quels types d'informations personnelles sont collectées, analysées et stockées. Pour chaque type de donnée, la start-up doit préciser la source, l'emplacement de stockage (y compris des copies), la durée de conservation, le délai de suppression après demande utilisateur, la finalité du transfert vers d'autres organismes, le but final, et les personnes autorisées à consulter la data.

La FTC sévère avec OpenAI ?

Selon plusieurs experts du secteur, les demandes de la FTC à OpenAI revêtent un caractère exceptionnel. Il est rare que l'agence américaine formule des demandes aussi complexes et détaillées. Depuis plusieurs mois, la Commission a averti qu'elle travaillait sur des mesures pour mieux réguler les entreprises évoluant dans le secteur de l'intelligence artificielle. Lors d'un discours à la Harvard Law School en avril, Samuel Levine, directeur du Bureau de la protection des consommateurs au sein de l'administration, a déclaré que l'agence n'était pas hostile par nature à l'IA. "La FTC est favorable à l'innovation, mais être innovant ne donne pas le droit d'être imprudent", expliquait alors le responsable relayé par le Washington Post. Une position partagée par la vice-présidente Kamala Harris, mercredi 12 juillet. "Prétendre que nous devons choisir entre faire progresser l'innovation et protéger les consommateurs est un choix trompeur. Nous pouvons faire les deux", assurait-elle.

Naturellement, OpenAI n'a pas manqué de contester vivement les accusations soulevées par la FTC. "Il est très décevant de voir que la demande de la FTC débute par une fuite et ne contribue pas à instaurer la confiance. Cela dit, il est extrêmement important pour nous que notre technologie soit sûre et favorable aux consommateurs, et nous sommes confiants quant au respect de la loi. Bien sûr, nous collaborerons avec la FTC", a déclaré Sam Altman.

Le PDG d'OpenAI assure que GPT-4 a été développé en "s'appuyant sur des années de recherche en matière de sécurité." Il promet que le modèle a été étudié et retravaillé six mois avant sa mise sur le marché pour "le rendre plus sûr et mieux aligné." Ce sera à la FTC de juger.