Comment construire des data stacks fonctionnels à l'ère de l'IA générative ?

Les potentialités offertes par l'IA générative (GenAI) en matière d'innovation stratégique et d'avantages concurrentiels suscitent un réel engouement dans les médias.

S'il reste encore des défis majeurs à relever pour tirer pleinement parti des précieuses informations provenant de multiples sources de données au sein des entreprises, on constate que des applications révolutionnaires telles que Chat-GPT ont déjà marqué l'opinion publique. Une étude mondiale d'Oliver Wyman publiée en début d’année révèle que 96 % des employés estiment que l'IA générative les aide dans leur travail.

C’est une nouvelle prometteuse pour les décideurs, désireux de bénéficier de la productivité promise par la GenAI grâce à l'automatisation de l’analyse des données. Toutefois, les entreprises qui conservent leurs données et leurs analyses sous forme de silos risquent de connaître un impact global décevant de ne pas permettre à leurs salariés une utilisation optimale de l’IA et, in fine, de connaître des déceptions.

Pour des prises de décision éclairées, il est crucial de transformer les données brutes en informations pertinentes. Pour y parvenir rapidement et à grande échelle, il est essentiel de rendre ces données accessibles à tous et de les exploiter pleinement. Ce n'est qu'ainsi que les entreprises pourront utiliser la GenAI pour libérer toute la puissance de leurs données, leur permettant de prendre des décisions plus rapides, plus avisées et plus efficaces que leurs concurrents.

Le recours à des data stacks adaptés aide à moderniser la gestion des données, et permet d’exploiter leur valeur plus efficacement, plus rapidement et à plus grande échelle. Malheureusement, la configuration inadéquate de data stacks complexes entrave le flux de données, surtout lorsqu'ils sont couplés à une multitude d'outils, à des silos de données, et qu’ils opèrent dans des environnements rigides. Les possibilités d'utilisation de la GenAI sont restreintes lorsque la plateforme ne peut pas accommoder une diversité d’utilisateurs aux compétences différentes, ou lorsque tous les membres du personnel ne peuvent pas exploiter pleinement la technologie pour créer de la valeur commerciale.

Priorités fondamentales

Les data stacks modernes et bien conçus offrent la possibilité aux salariés de tirer pleinement parti de la valeur des données. Les organisations dotées de data stacks flexibles et fonctionnels sont celles qui bénéficieront le plus de l'exploitation des capacités de l'IA et de ses données. Lors de la conception des data stacks, les DSI doivent accorder une attention particulière à trois facteurs clés lors du processus de planification :

  • Revenus : comment cela va-t-il améliorer les revenus ou les marges ?  
  • Expérience client : comment les technologies répondront-elles aux attentes en constante évolution des clients lors de leurs parcours d’achat ? 
  • Expérience employé : comment garantir aux collaborateurs l’accès aux données et aux informations dont ils ont besoin pour être productifs, et ainsi améliorer leur travail au quotidien ?  

En définitive, les entreprises qui exploitent efficacement et rapidement leurs données et leurs analyses sont celles qui accroîtront leurs revenus, proposeront une expérience client améliorée et renforceront la productivité de leurs employés par rapport à leurs concurrents.

Tout comme les bâtiments ont besoin de fondations solides, les data stacks nécessitent une infrastructure robuste composée de données essentielles : stockage, cadre de gouvernance des données, ETL, analyse et reporting. Ainsi, l’entreprise augmente la création de valeur. Il est crucial que les architectes des données conçoivent des data stacks avec une vision d'avenir, en tenant compte de l'évolutivité et de la flexibilité. Ils doivent être capables de répondre aux besoins croissants de l'entreprise et de s'adapter à l'augmentation des volumes de données.

Favoriser l’intégration et l'interopérabilité grâce à une technologie polyvalente

Les données peuvent être stockées, consultées et analysées dans divers emplacements. Bien que les avantages du cloud computing soient considérables et largement reconnus aujourd'hui, on estime encore que 85 % des entreprises continueront d’utiliser une variété d'outils d'analyse sur site l'année prochaine. L’ infrastructure de données doit offrir une flexibilité suffisante pour prendre en charge divers scénarios de déploiement, notamment la gestion des flux de données, qu'ils soient sur site, privés, publics ou multi-cloud. Elle doit également permettre aux opérateurs de transformer leurs données dans l'entrepôt de données de leur choix, et de concevoir des flux de données à un endroit pour les exécuter ailleurs.

Les plateformes capables de déploiement à la fois sur site et en mode SaaS sur plusieurs clouds, ainsi que de collaboration au développement et à la gestion des flux de données s'exécutant directement via des programmes tels que Databricks, Snowflake et AWS, sont une base précieuse des infrastructures de données. Ces fonctionnalités flexibles et ces flux de données fluides, intégrés de manière transparente avec les outils existants, permettent d'accélérer le processus analytique. Cela favorise également la progression vers des connaissances basées sur l'IA, car les équipes peuvent construire plus rapidement des modèles et des applications d'IA efficaces en se basant sur des données de qualité.

Rallier tous les salariés à la culture de la donnée

Les dirigeants l’ont compris : le succès de l'IA générative en interne dépend de la capacité de tous les employés, et pas seulement des techniciens, à maîtriser les données et à les utiliser pour résoudre les défis commerciaux et prendre les meilleures décisions possibles 

Bien que les données soient essentielles pour obtenir des résultats dans tous les secteurs, de nombreux outils d'analyse n'ont pas été conçus pour être accessibles à tous. Par conséquent, l'analyse des données est souvent restée l'apanage de profils nécessitant des compétences spécifiques. L'objectif principal de la modernisation des data stacks est de permettre à tous les salariés de bénéficier pleinement des ressources disponibles en matière de données, de calcul et d'automatisation.

Pour développer des offres personnalisées pour les clients, réduire le taux de désabonnement ou garantir la conformité réglementaire, chaque secteur d’activité devrait pouvoir trouver des solutions originales à ses défis analytiques et appliquer sa propre expertise métier à des cas d'utilisation pertinents et concrets. Pour ce faire, il est essentiel de privilégier des interfaces de données accessibles et conviviales, de préférence avec un minimum de code, voire sans code du tout - afin que tous les collaborateurs, et pas seulement les ingénieurs ou les data scientists, puissent collecter et analyser les données.

Les applications à faible ou sans code sont un moyen efficace de rendre ces interfaces de données accessibles à un large éventail d'utilisateurs. Selon Gartner, d'ici 2025, 70% des nouvelles applications utiliseront des solutions à faible code pour permettre aux salariés ayant une expertise métier de maîtriser l'analyse. En donnant la priorité à cette approche, l’entreprise permet à tous ceux qui travailleront avec des données de bénéficier des investissements réalisés. 

C'est une période passionnante pour les DSI et les responsables informatiques, qui doivent aider les entreprises à exploiter efficacement l'IA pour stimuler l'innovation stratégique et créer des avantages concurrentiels. En maîtrisant les aspects essentiels des data stacks modernes, en accélérant le traitement des données et en favorisant une culture axée sur les données, les entreprises seront mieux positionnées pour bénéficier des analyses pertinentes proposées par la GenAI et répondre aux défis analytiques de plus en plus complexes.