Permettre une utilisation facile et sécurisée des données face à l'IA et aux nouvelles réglementations

Les entreprises ne peuvent pas s'assurer d'une sécurité totale de leurs données et devront faire des choix. Toutefois, sauvegarder les données de qualité est un choix de sécurité très opportun.

Les entreprises ont, depuis toujours, été confrontées à l’enjeu de maintenir leurs données sécurisées et accessibles facilement. Celui-ci s’est toutefois fortement complexifié ces vingt dernières années, sous l’effet de l’avènement de la dématérialisation, entraînant une production exponentielle de données collectées, stockées et utilisées. Une croissance qui entre à l’heure actuelle dans une nouvelle phase avec l’adoption généralisée de l’IA.

En parallèle, un renforcement des réglementations portant sur les données s’opère de la part des gouvernements à travers le monde, afin de s’adapter aux évolutions liées aux données. Cette pression s’exerce sur les entreprises qui doivent assurer la résilience de leurs données, en même temps qu’elles se lancent dans l’ère de l’IA. L’enjeu est de garantir la sécurité et la résilience des données, en conformité avec les réglementations en cours, tout en étant utilisables.

Savoir localiser les données

Pour pouvoir profiter des avantages largement connus de l’IA, les entreprises doivent cependant faire face à des exigences élevées portant sur leurs données, imposant leur exactitude, leur accessible et leur capacité à être utilisables à tout moment. Après la période de frénésie autour de l’IA, il est temps pour les entreprises de se lancer concrètement dans l’IA pour tirer la valeur commerciale de leurs données.. Plus de six entreprises sur dix (65%), selon la dernière étude mondiale de McKinsey portant sur l’IA, utiliseraient régulièrement l’IA. La question qui se pose ensuite est de savoir où en est leur niveau de résilience des données.

C’est bien connu, les données sont le moteur de l’IA : en plus du critère quantitatif, selon lequel elles doivent nombreuses, elles doivent aussi respecter des critères qualitatifs, à savoir être exactes et pertinentes. En effet, la plupart des applications d’IA requièrent un accès en temps réel et permanent aux données pour analyse le moindre changement. C’est pour cela que la moindre incohérence ou inexactitude dans la banque de données utilisée peut fortement impacter les résultats produits par l’IA. On pourrait résumer ce principe en disant qu’une donnée d’entrée absurde ou défectueuse produira inévitablement une donnée de même nature. Une grande attention est requise aussi pour les données sensibles, critiques ou personnelles qui sont utilisées pour nourrir un outil d’IA. Trouver un équilibre est crucial, à mesure que de plus en plus d’entreprises se tournent vers l’IA.

L’arrivée de nouvelles réglementations imposant plus de responsabilité et de résilience sur les données, de façon générale mais aussi forcément sur l’IA, pourrait aider les entreprises à trouver un équilibre, par exemple grâce à NIS2 ou l’AI Act européen. L’objectif est de renforcer la chaîne de traçabilité (COC) des entreprises sur leurs données, en établissant une stratégie de sécurité pour encadrer leur intégration à l’IA ou à d’autres technologies. Rares sont les entreprises à avoir intégré dans leurs projections l’influence de l’IA sur la collecte et le stockage de leurs données, pas plus que la façon dont elles seraient utilisées. Si ces considérations relèvent tout d’abord de la responsabilité des équipes du DSI, la mise en conformité avec les réglementations liées à l’IA exige des efforts de la part de l’ensemble de l’entreprise. Il est important d’assurer l’accès des équipes concernées aux données qu’elles utilisent pour innover et se développer.

Répondre à une situation qui se répète

La certitude qu’ont les entreprises aujourd’hui, c’est de devoir assurer aussi bien un accès rapide à leurs données et un renforcement de leur résilience, pour rester conformes aux réglementations en vigueur. Un enjeu récurrent pour les entreprises depuis plusieurs années déjà, qui peut sembler herculéen, et auquel se rajoutent à présent de nouveaux systèmes et circonstances à prendre en compte.  

Sous l’effet de l’évolution de la technologie, des environnements et de la portée, ce défi évolue aussi sans disparaître. Presque huit entreprises sur dix (76%) révèlent constater un écart de protection, c’est-à-dire un écart entre la quantité de données qu’elles peuvent perdre et la fréquence à laquelle leurs données sont protégées. Si ce chiffre est élevé, l’écart aurait pourtant diminué durant les dernières années, mais pourrait bel et bien augmenter à nouveau si rien n’est fait, sous l’influence de l’IA et du besoin de grandes quantités de données.

Il est important pour les équipes de collaborer, aussi bien sur le plan de la gouvernance des données, que de la sécurité informatique et de la production, pour préserver la résilience des données. Cela permet aux entreprises d’améliorer leur utilisation des données pour l’IA, en établissement conjointement de nouvelles procédures d’évaluation des risques.

Ces nouvelles réglementations imposent une révision des habitudes de protection des données, ce qui signifie du travail additionnel pour les entreprises. Ces dernières ne doivent pas attendre l’entrée en vigueur de directives pour cela, et doivent plutôt considérer cet enjeu comme nécessitant un processus régulier et continu, surtout avec l’essor de l’IA.

Le double enjeu des sauvegardes

Il faut s’attendre à voir les sauvegardes devenir centrales pour l’enjeu de la réglementation, notamment celle spécifique à l’IA et qu’elles fournissent un point d’ancrage indispensable aux équipes chargées du développement de l’IA et des LLM, un aspect essentiel dans un environnement en constante évolution.

Sauvegarder les données permet d’assurer qu’elles restent sécurisées, utilisables et exactes à tout moment, tout en apportant un ensemble complet d’informations qui prouvent la conformité des entreprises aux réglementations. Une sauvegarde peut ainsi être vue comme une source de vérité inestimable, puisque la nature même de l’IA l’empêche d’expliquer concrètement la manière dont elle a utilisé les données qui lui ont été fournies ou sur lesquelles elle a été entraînée. Les sauvegardes permettent également aux entreprises d’attester à tout moment de la sécurité de leurs données, et ce peu importe l’endroit où elles sont utilisées.