L'infrastructure à l'heure de l'IA : le vrai sujet n'est pas le modèle, c'est l'architecture

Avanade / Accenture

L'intelligence artificielle est souvent présentée comme une révolution des usages, des interfaces ou des modèles. En réalité, sa transformation la plus profonde est ailleurs : dans l'infrastructure.

Depuis deux ans, le débat sur l’intelligence artificielle se focalise sur les modèles, les usages, les promesses, parfois les fantasmes. On parle de copilotes, d’agents, de productivité, de disruption. Mais dans les entreprises, le vrai sujet est souvent ailleurs. Il est moins visible, moins “marketable”, et pourtant beaucoup plus décisif : l’infrastructure. Car l’IA ne se contente pas d’ajouter une nouvelle couche logicielle. Elle change la nature même des systèmes que nous devons bâtir, opérer et financer.

Pendant longtemps, l’infrastructure informatique a vécu dans un monde relativement lisible. Les applications étaient prévisibles, les pics de charge identifiables, la montée en capacité suivait une logique presque linéaire. Plus de trafic ? On ajoutait des serveurs. Plus de données ? On augmentait le stockage. Le paradigme était celui d’une infrastructure stable, dimensionnée, pilotée par des métriques connues. L’IA casse ce cadre. Un grand modèle ne se déploie pas comme une application web. Il ne consomme pas les ressources de la même manière. Il ne répond pas avec la même régularité. Il ne tolère pas les mêmes approximations.

Le premier choc est celui des workloads. Sous le mot “IA”, on mélange en réalité plusieurs mondes. L’entraînement mobilise une puissance massive pendant des heures ou des jours. Le fine-tuning relève davantage de l’atelier d’expérimentation, plus agile mais néanmoins exigeant. L’inférence, elle, devient le vrai terrain de production, avec une contrainte immédiate de latence, de disponibilité et de coût. À cela s’ajoute la diversité des modèles eux-mêmes : LLM, multimodal, agents. Les agents, notamment, changent profondément la donne, car ils transforment une simple requête en workflow continu, fait d’appels successifs, de mémoire, d’outils et de décisions intermédiaires. L’infrastructure ne gère plus seulement des requêtes. Elle orchestre des chaînes d’intelligence.

C’est ici qu’apparaît le triangle infernal de l’IA : latence, throughput, coût. Réduire le temps de réponse suppose des GPU puissants, des instances préchargées, des architectures plus chères. Augmenter le débit pousse au batching et à la mutualisation, avec un risque immédiat sur la latence. Réduire les coûts oblige à sous-provisionner, à choisir des modèles plus petits, ou à accepter des files d’attente. En clair, chaque décision technique devient un arbitrage économique. Et chaque arbitrage économique finit par avoir un impact direct sur l’expérience utilisateur.

Mais l’erreur la plus fréquente serait encore de croire que le compute est le vrai centre du jeu. En réalité, dans la plupart des cas, le nœud stratégique est la donnée. C’est elle qui détermine la qualité réelle des systèmes d’IA. C’est elle qui conditionne la pertinence, la fraîcheur, la robustesse et la conformité des usages. On peut louer davantage de puissance de calcul. On peut acheter des GPU. On peut scaler des clusters. En revanche, on n’achète pas une bonne infrastructure de données en quelques clics. Elle se construit dans le temps, avec de la discipline, de la gouvernance et des choix structurants.

Cette bascule est fondamentale. Pendant des années, le stockage était perçu comme une commodité. Dans l’ère IA, il redevient stratégique. Les organisations passent du data lake au lakehouse, puis au streaming, parce que la donnée n’est plus seulement un stock à conserver : elle devient un flux à exploiter, à enrichir, à fiabiliser presque en continu. Les systèmes d’IA les plus utiles sont précisément ceux qui s’appuient sur des données vivantes, contextualisées, traçables. L’infrastructure de données ne sert plus seulement à archiver le passé ; elle alimente en permanence les décisions du présent.

Le défi se complique encore avec la donnée non structurée. Texte, images, audio, vidéo, documents composites : c’est précisément ce que les modèles modernes savent exploiter, mais c’est aussi ce que les systèmes d’information classiques gouvernent le plus mal. L’IA aime le non-structuré ; l’infrastructure, historiquement, beaucoup moins. Résultat : la performance réelle d’un projet dépend de plus en plus de sujets longtemps considérés comme secondaires — formats, métadonnées, cache, pipelines d’accès, qualité des jeux de données, versioning, lineage. Le glamour est du côté des modèles. La vérité opérationnelle est du côté des flux et des fondations.

C’est pourquoi la gouvernance n’est plus un sujet de conformité périphérique. Elle devient une condition d’industrialisation. Sans gouvernance, pas de reproductibilité. Sans qualité, pas de confiance. Sans traçabilité, pas d’audit. Sans visibilité sur les sources, les transformations et les usages, les organisations accumulent de la dette technique, multiplient les copies inutiles, prennent des risques réglementaires et ralentissent leurs propres équipes. À l’inverse, une gouvernance bien pensée accélère les data scientists, améliore la qualité des modèles et réduit les coûts invisibles.

Le compute, bien sûr, ne disparaît pas. Il reste indispensable. Le recours aux GPU, aux TPU et aux accélérateurs spécialisés s’impose parce que l’IA moderne repose sur un calcul massivement parallèle, impossible à soutenir efficacement avec une logique CPU classique à grande échelle. Mais là encore, le sujet n’est pas simplement la puissance brute. Il est dans l’adéquation entre un type de compute, un type de workload et un objectif métier. La vraie maturité n’est pas de “prendre plus gros”. C’est de choisir plus intelligemment.

Au fond, l’IA impose un retour brutal du réel dans l’informatique d’entreprise. Retour de la physique avec la mémoire, les échanges réseau, la chaleur, la bande passante. Retour de l’économie avec des coûts qui explosent si l’on ne pilote pas finement. Retour de la discipline avec la qualité des données, la gouvernance et l’observabilité. Retour, enfin, de l’architecture comme sujet stratégique. Pendant des années, beaucoup ont pensé que le cloud avait rendu l’infrastructure presque invisible. L’IA prouve exactement l’inverse : elle la remet au centre.

La vraie question pour les entreprises n’est donc pas : “Comment ajouter de l’IA ?” La vraie question est : “Sur quelle infrastructure de données, de calcul, de gouvernance et d’arbitrage voulons-nous bâtir notre ambition IA ?” Tant que cette question n’est pas posée sérieusement, beaucoup de projets resteront des démonstrateurs brillants mais fragiles. Lorsqu’elle l’est, l’IA cesse d’être une mode. Elle devient un levier durable de transformation.

Je peux aussi vous faire maintenant une version encore plus “tribune dirigeant”, plus premium, plus dense, avec une chute finale très forte pour donner envie d’acheter le livre.