Le secteur automobile dans l’impasse avec des pétaoctets de données ?

Si les voitures connectées et la conduite autonome deviennent réalité, chaque véhicule produira plusieurs pétaoctets de données par an. Un défi de taille en matière de stockage et d'analyse.

L’avenir de l’automobile soulève beaucoup de questions. Les systèmes de mobilité actuels font face à de nombreux défis. Du fait de la mondialisation et de l’urbanisation, la densité du trafic routier a considérablement augmenté. C’est pourquoi constructeurs automobiles et fournisseurs de technologies s’emploient à rendre la conduite plus efficace, plus sûre et plus écologique. À cet égard, la digitalisation du véhicule lui-même, mais aussi de son environnement, constitue un facteur clé. Il ne fait aucun doute que la conduite autonome et connectée deviendra bientôt réalité. Les constructeurs ont déjà démontré l’aptitude de nombreux prototypes de voitures, camions et bus autonomes et connectés à prendre la route. Les premiers bus et taxis autonomes circulent déjà sur des pistes d’essai à Shanghai et à Zurich, tandis que des voitures autonomes sont testées en situation réelle depuis environ deux ans sur l’autoroute qui relie les villes d’Ingolstadt et de Munich en Allemagne dans le cadre d’un projet pilote. Les progrès technologiques rapides enregistrés dans les domaines des logiciels, de l’intelligence artificielle, des microcircuits et des capteurs ouvrent la voie à une production de masse de véhicules autonomes et connectés.

Digitalisation : un grand chantier en construction   

Il reste encore beaucoup de travail à accomplir avant que les véhicules autonomes ne fassent partie de notre quotidien, qu’il s’agisse de réorganiser l’infrastructure de transport, de créer un cadre légal approprié, ou encore de mettre en place des mesures de protection des données et de sécurité informatique. Autre difficulté quantifiable : les volumes sans précédent de données engendrés. L’industrie automobile et des transports se réinvente et se pose en pionnier du numérique par rapport à d’autres secteurs, ce qui fait qu’elle génère automatiquement d’importantes quantités de données. Un véhicule d’essai produit à lui seul cinq à dix téraoctets de données par jour, soit plusieurs pétaoctets par an. Un chiffre qui doit encore être multiplié par le nombre de véhicules de test utilisés par les constructeurs automobiles. Lorsque les véhicules autonomes et connectés déferleront dans nos rues, des volumes considérables de données seront générés. En définitive, l’automobile du futur n’est rien d’autre qu’un ordinateur roulant connecté à l’environnement, à l’infrastructure et à Internet. Un ordinateur qui produit et traite des données en continu pour être utilisé en tant que moyen de transport sur roues. Le système automatique d’appel d’urgence (« eCall ») devenant obligatoire dans l’UE au mois de mars 2018, pratiquement chaque automobile produite est déjà un véhicule connecté. Le futur de l’automobile dépend par conséquent d’un certain nombre de questions, notamment : comment traiter les nouveaux volumes de données, et comment gérer ces derniers de manière intelligente, efficace et sûre.

Un effondrement annoncé des données ?

Il n’est pas facile de trouver une réponse appropriée à ces questions. Après tout, ce n’est pas uniquement le produit final, c’est-à-dire la voiture connectée, qui génère une telle masse d’informations. C’est aussi l’industrie dans son ensemble. Les constructeurs automobiles s’appuient sur un réseau mondial complexe d’équipementiers, de prestataires de services et de partenaires, qui doivent tous mettre en place une infrastructure informatique interne adéquate afin de conserver et gérer efficacement leurs données d’entreprise critiques. Ils doivent en outre se doter d’un équipement technologique facilitant l’échange de données entre les différentes parties prenantes. Entre la recherche, le développement, la production, le lancement du produit et la distribution, cet échange d’informations peut durer plusieurs années. L’automobile connectée n’arrive qu’en bout de chaîne. Et la gestion de ses données exige l’interaction intelligente de tous les composants, depuis l’ordinateur embarqué jusqu’au datacenter et au cloud.

À qui revient la responsabilité en cas d’accident ? 

Choisir d’emblée les bonnes solutions technologiques, ainsi qu’une stratégie adéquate de protection, d’échange et d’archivage à long terme des données, est une condition essentielle au succès des constructeurs automobiles, qui revêt par ailleurs une importance critique d’un point de vue juridique. Il suffit de prendre l’exemple d’un accident de voiture pour s’en rendre compte. En théorie, les constructeurs automobiles peuvent en être tenus pour responsables. En cas de procédures juridiques, il leur incombe de démontrer comment le véhicule a été testé et pourquoi il a été jugé apte à prendre la route. Il leur faut pour cela s’appuyer sur les données de test, lesquelles doivent rester accessibles aux législateurs pendant sept à dix ans. En cas de doute, l’accident peut alors être imputé à de la négligence humaine, ce qui disculpe le constructeur. Les données de test sont en grande partie générées dans des sous-systèmes par les équipementiers qui en conservent également une copie pour leur propre protection. Il est toutefois essentiel qu’elles soient accessibles aux constructeurs. Chaque maillon de la chaîne logistique est tenu de sécuriser les données, et d’agir à tous les stades de la recherche, du développement et de la production de l’automobile le plus consciencieusement possible. Le développement de voitures connectées et autonomes donne lieu à des questions d’ordre juridique de plus en plus controversées, la principale étant de savoir qui portera la responsabilité des accidents causés par des véhicules autonomes : l’homme ou la machine ?

Rattraper le retard en matière de gestion stratégique des données

L’exemple de l’accident de voiture illustre les écueils juridiques auxquels les entreprises de l’industrie automobile s’exposent et explique pourquoi elles ne peuvent se permettre de négliger la question de la gestion stratégique des données. Et pourtant, comme le démontrent certaines études, il existe un écart entre les ambitions et la réalité. Alors que la majorité des constructeurs et des équipementiers de l’industrie automobile aspirent à un très haut niveau de digitalisation, seul un sur cinq a mis en place une stratégie de digitalisation et de gestion des données. Une situation pour le moins paradoxale quand on sait que les entreprises ont à leur disposition des solutions informatiques performantes qui pourraient grandement leur simplifier la tâche.

Règle du « 3-2-1 » : une pratique éprouvée et utile

Les constructeurs automobiles du monde entier utilisent généralement une infrastructure informatique très complexe, qui s’est étendue au cours des décennies. Aussi se retrouvent-ils régulièrement prisonniers de structures traditionnelles cloisonnées, qui font obstacle à une gestion économique, efficace et agile des données. Pour remédier à cette situation, une protection intelligente des données est essentielle et le sera d’autant plus au vu des pétaoctets de données qui se profilent à l’horizon. Il est par conséquent recommandé de continuer à sauvegarder les données selon la règle éprouvée du « 3-2-1 », laquelle consiste à stocker au moins trois copies des données sur deux médias de sauvegarde différents, dont une sauvegarde hors site. Même à l’ère de la mobilité et du multi-cloud, cela reste la meilleure méthode de protection contre les pannes matérielles, les cyberattaques, ainsi que la corruption et la perte de données dues à des « erreurs humaines », comme on les surnomme dans l’industrie informatique.

Stockage multiniveau : une solution efficace et économique

Des médias de sauvegarde efficaces comme les disques hautes performances ou les disques SSD avec déduplication des données accélèrent la sauvegarde et la restauration initiales des données. La déduplication recherche et supprime automatiquement les doublons, sans compromettre l’intégrité des données. Dans les cas de rétention à long terme des données, par exemple l’archivage « à froid » ou actif des données, qui ne nécessitent pas un accès en temps réel, un média de stockage économique, tel que la bande, le stockage objets ou le cloud, est tout à fait indiqué. Il est par ailleurs essentiel que les données critiques ne soient ni corrompues ni supprimées. Lors du choix du support de stockage, les informaticiens doivent toujours appliquer le principe du « stockage multiniveau ». Avec cette approche, les données sont réparties sur différents médias de stockage selon des catégories telles que le débit ou la vulnérabilité. L’objectif est de réduire les coûts informatiques globaux tout en garantissant un accès ultra-performant aux données actives. On pourra, par exemple, stocker les données critiques souvent consultées sur un disque onéreux ou SSD, et le contenu le moins fréquemment utilisé sur un média de stockage plus économique, comme la bande ou le cloud.

Logiciels de catégorisation transparente des données, régie par des règles

Automatiser la catégorisation des données peut, de toute évidence, se révéler bénéfique. Des fournisseurs de technologies proposent des logiciels permettant d’automatiser ce processus complexe de gestion des données au moyen de règles prédéfinies. L’un des principaux avantages de certaines solutions est la transparence. Même si un fichier est automatiquement transféré vers un autre niveau de stockage, il reste visible à l’utilisateur à son emplacement habituel. Il est important de choisir un logiciel de gestion des données capable de s’intégrer en toute transparence dans des environnements collaboratifs, un aspect essentiel de la recherche et du développement de nouveaux modèles automobiles. Le logiciel doit fournir des performances optimales, même au sein d’environnements de stockage hébergeant plusieurs centaines de pétaoctets de données sur disque, sur bande ou dans le cloud. Des fonctions de supervision, d’alerte et d’analyse/recherche détaillées sont en outre une nécessité absolue.

Puissance et évolutivité : stockage NAS en mode « scale-out »

Compte tenu de l’acquisition, du traitement, de l’analyse, de la distribution et de l’archivage de volumes croissants de données, les solutions de stockage spécialisées doivent intégrer un NAS d’entreprise. Acronyme de Network Attached Storage (stockage rattaché au réseau), le NAS désigne un serveur de fichiers en réseau facile à gérer. Les solutions NAS d’entreprise traditionnelles sont toutefois incompatibles avec de nombreux scénarios d’IoT allant des véhicules connectés à la conduite autonome. C’est ce qui a conduit de nombreux utilisateurs à opter pour le NAS en mode « scale-out » au cours des dix dernières années. Le grand avantage du NAS en mode « scale-out » est qu’il permet d’étendre facilement l’intégralité de l’espace de stockage du disque dur. Une possibilité qui se traduit par une réduction des coûts et une utilisation plus efficace des ressources matérielles. Outre qu’elle ne facilitait pas l’intégration de stratégies cloud ni le partage des données, cette technologie a souvent pâti d’un manque d’options d’évolutivité dans le passé.

Des plateformes de stockage adaptées à l’ère de la 5G 

Le talon d’Achille d’une voiture autonome et connectée est le réseau via lequel elle communique avec d’autres véhicules et avec l’infrastructure du datacenter. C’est la raison pour laquelle le CES, salon de l’électronique, a cette année été placé sous le signe de la 5G, nouvelle norme de communications mobiles qui promet un haut débit, davantage de bande passante et un temps de latence extrêmement faible. Des plateformes de stockage « end-to-end » parfaitement intégrées et couvrant tout le cycle de vie des données sont indispensables à une communication automobile optimale et sans erreurs, ainsi qu’à un traitement des données performant dans le cadre de tâches telles que la sauvegarde et l’analyse. Avec le débit de 10 Gbits/s et les temps de latence inférieurs à 10 millisecondes attendus de la 5G, l’intégration avec les réseaux Ethernet les plus puissants, par exemple via des interfaces SMB et NFS, est un point à prendre en considération lors du choix de solutions de stockage. 

Intelligence artificielle : une tendance incontournable

Même si l’avenir de l’automobile soulève encore de nombreuses questions, une chose est sûre : il donnera la part belle aux données ainsi qu’aux logiciels, et l’intelligence artificielle y jouera un rôle clé. En plus de la sauvegarde traditionnelle et de la gestion intelligente des données, l’évaluation de ces informations est essentielle à une prise de décisions plus judicieuses par l’automobile. C’est pourquoi l’avenir appartient surtout aux solutions de stockage qui s’intègrent parfaitement avec l’intelligence artificielle et permettent ainsi d’interroger les données selon différents critères en vue d’analyser les événements, objets, visages et mots.

Gestion des données, clé de la réussite

Bien que la plupart des automobiles fonctionnent encore à l’essence ou au diesel, la transition vers des véhicules électriques connectés et autonomes avance à grands pas. Pour les constructeurs automobiles, refuser d’investir dans une stratégie de gestion des données n’est pas une option. À ce propos, Dinesh Paliwal, directeur général de l’américain Harman, entreprise d’électronique et équipementier automobile, a déclaré : « Les données sont la monnaie de demain de l’industrie automobile. Pour se tailler la part du lion sur ce marché, les entreprises devront faire preuve d’une parfaite maîtrise de la gestion des données. »