Démocratisation de l’IoT : préparez-vous à gérer le torrent de données

Si l’on peut légitimement qualifier de colossale la quantité de données générées à l’heure actuelle, ce n’est qu’une goutte d’eau par rapport au volume, à la variété et à la vitesse de celles que produiront demain les véhicules connectés et les chaînes d’approvisionnement dotées de capteurs reliés au web. La gestion de ces données s’annonce évidemment très complexe, et soulève plusieurs questions que nous allons passer en revue.

Tous les objets "connectés" sont, à ce titre, bardés de capteurs qui génèrent des données en continu pour permettre à leurs utilisateurs de connaître précisément leur état du moment. Si l’on multiplie ces volumes de données par le nombre de véhicules concernés, on s’aperçoit que les entreprises vont devoir se préparer à traiter des milliers de data émanant de milliers de camions, d’autobus et de voitures. Les conteneurs de transport pourront aussi émettre des informations en temps réel sur leur position géographique, leur état et les éventuels problèmes qu’ils rencontrent. Autant d’éléments qui s’entremêleront pour faire de la gestion des données un véritable casse-tête.

Et l’on ne parle-là que des appareils qui font l’objet d’un suivi aujourd’hui. Nombre de grands groupes internationaux de logistique désirent accroître le nombre de points de données qu’ils supervisent sur chaque colis ou envoi, à telle enseigne qu’ils devraient passer d’une vingtaine de points à l’heure actuelle à plus de cent dans un futur proche.

Absorber le torrent de données à venir

Cette explosion des volumes de données pourrait, cela va sans dire, s’avérer problématique. Jamais nous n’avons généré autant de données qu’aujourd’hui, ce qui fait que la conception d’infrastructures IT aptes à absorber le torrent d’informations entrantes est de plus en plus difficile. Les nouvelles offres comme le cloud public apportent assurément des solutions à ces problèmes, mais sont-elles adaptées aux données générées par l’Internet des objets ?

Il peut être judicieux de se pencher sur la façon dont ces données parviennent aux bases de données et sont traitées par ces dernières. Les bases de données stockent des données destinées à des finalités différentes : systèmes de transaction facilitant le suivi d’instructions, registres permettant l’archivage à long terme, et systèmes d’analyse de données voués à jeter un éclairage complémentaire sur ce qui se passe au quotidien. Pour les données de l’IoT, qui sont produites par des milliers de capteurs et très sensibles à l’ordre des points de données, la gestion de ce gigantesque volume d’informations suppose de pouvoir s’adapter aux variations de dimensionnement... ce qui est précisément un des points forts des bases de données cloud.

Plutôt que de moderniser leurs systèmes informatiques internes, les entreprises ont tout à gagner à recourir au cloud public, qui possède les capacités de mise à l’échelle requises pour s’adapter très rapidement aux fluctuations de la demande. Les bases de données cloud peuvent répondre à ces besoins, mais certains obstacles restent à surmonter.

Le premier est celui de la confiance. Nombre d’entreprises du secteur de la logistique et du transport, a fortiori celles qui opèrent à l’international, ont aujourd’hui des jeux de données et d’applications dont elles ont un besoin vital pour exercer leur activité. Dans bien des cas, elles auront du mal à faire migrer ces applications vers des fournisseurs de services cloud.

Ajoutons également que les données constituent intrinsèquement un atout inestimable. Bien que les fournisseurs de services cloud soient probablement mieux armés que l’entreprise X ou Y pour concevoir et bâtir des dispositifs aptes à protéger efficacement leurs systèmes informatiques, leurs clients sont de plus en plus désireux de contrôler la manière dont leurs données sont stockées, consultées et exploitées. Les entreprises de logistique veulent garder la main sur leur destin plutôt que de s’en remettre totalement à un tiers.

Beaucoup d’entreprises du commerce de détail, de la logistique et du transport doivent composer avec l’arrivée sur leur marché de nouveaux acteurs comme Amazon. Elles se savent condamnées à rivaliser avec ceux-là mêmes qui, demain, seront peut-être leurs fournisseurs d’infrastructure cloud.

En d’autres termes, les déploiements cloud hybrides séduisent de plus en plus d’entreprises des secteurs de la logistique et du transport. Gartner estime ainsi qu’à l’horizon 2020, environ 90 % des sociétés adopteront des capacités de gestion d’infrastructure hybride et que la dépense allouée aux services d’infrastructure cloud, aussi appelés cloud compute, devrait atteindre 60 milliards d’euros.

Le deuxième obstacle majeur est celui de la complexité. Les entreprises de logistique s’appuient sur des réseaux d’applications extrêmement sophistiqués pour faire tourner leurs processus et créer des données en interne, mais aussi pour le traitement des données émanant d’objets connectés. Et elles peuvent placer beaucoup d’espoirs dans l’agrégation de ces deux jeux de données.

Cependant, préparer les données dans cette optique est bien plus complexe qu’il n’y parait. Là où le cloud-based compute et les services de stockage peuvent s’agrandir rapidement pour absorber toutes ces informations, les bases de données en sont incapables. Et pour cause, la plupart des bases classiques reposent sur des technologies conçues pour une seule instance ou des petits clusters situés sur un seul et même site, ce qui les rend inadaptées au cloud.

Diffuser les données

Les entreprises qui passent au cloud computing dans la foulée du déploiement de nouveaux services IoT ne peuvent se contenter d’héberger sur le cloud des instances de bases de données. Elles doivent se doter de bases dont l’architecture est pensée, dès le départ, pour s’accommoder du cloud. En d’autres termes, celles-ci doivent être entièrement distribuées, capables de s’exécuter sur un nombre de nœuds illimité, et ce en l’absence du nœud "maître" qu’on retrouve d’ordinaire sur les instances de ce type.

De même, une base de données cloud doit traiter les données que des milliards de capteurs, d’appareils et de personnes disparates produisent sans discontinuer depuis des régions et des canaux différents. Cela implique de pouvoir redimensionner ses capacités ainsi que de s’adapter rapidement et de façon prévisible au niveau de demande.

Pour qu’un déploiement cloud hybride fonctionne sur plusieurs systèmes, il ne doit pas être tributaire du cloud sous-jacent, que celui-ci soit privé ou public. Dans l’idéal, il doit pouvoir s’exécuter sur de multiples clouds publics pour tirer parti des sites et services les moins distants des clients. La capacité à s’exécuter depuis plusieurs endroits et à être actif n’importe où — indépendamment du type de service cloud ou de l’identité du fournisseur de l’infrastructure hôte — devrait permettre de composer avec l’énorme flux de données induit par la mise en place de stratégies IoT.

L’étude que Gartner a consacrée aux grandes entreprises européennes de logistique rappelle combien la collaboration et l’expérimentation sont des facteurs clés de succès du déploiement des nouvelles technologies. Les bases de données cloud peuvent aider les entreprises à fournir ce type de services pour le traitement des données issues de l’IoT, quelle que soit la taille que le jeu de données est voué à prendre.