Analyse des données dans le cloud hybride : deux notions irréconciliables ?

La notion d'"analyse dans le cloud hybride" a commencé à faire son apparition sur le marché de la business intelligence. Mais c’est un terme souvent mal compris, voire utilisé à tort et à travers.

Le cloud n’est rien d’autre qu’un mode de distribution – d’infrastructures, d’applications ou de services. Les entreprises peuvent choisir parmi différentes options de déploiement : sur site, dans un cloud privé en s’appuyant sur l’infrastructure de leur choix ; ou bien dans un cloud public mis à leur disposition par de grands opérateurs.  De ces choix dépendent l’endroit où vont se trouver leurs données et le niveau d’accessibilité à ces données. Les entreprises doivent donc aussi anticiper où elles vont exécuter leurs analyses de leurs données. Une fois le choix fait, il sera souvent trop tard pour les gérer autrement. 

Avec la démultiplication des sources et du volume de données,  les entreprises ont besoin de capacités d’analyse encore plus importantes pour explorer et comprendre ces données.  C’est un élément clé pour découvrir ou bénéficier de nouvelles informations et prendre ainsi des décisions pertinentes.

La plupart des entreprises possèdent à la fois des données et des applications sur site, derrière leur pare-feu, et des données et des applications exécutées sur le cloud. Le cloud hybride se définit comme un environnement informatique qui repose sur un mélange d’infrastructures sur site de clouds privés et public reliées entre elles pour offrir des services.  Cela peut se traduire par l’association de plusieurs clouds ou par le regroupement d’installations sur site et d’installations sur le cloud.

Une approche hybride correspond aux attentes actuelles des entreprises et leur permet de migrer une grande partie de leur charge de travail dans des environnements externes lorsqu’elles le souhaitent. Cette approche est tout aussi légitime en ce qui concerne les plateformes analytiques. Une capacité d’analyse s’appuyant sur un cloud hybride donne une grande latitude pour exploiter et explorer les données de manière plus efficace. Pour les analyses et les applications à caractère confidentiel l’exploitation in situ est une bonne option, tandis que pour la mise en place d’applications d’analyse ad hoc, par exemple,  le cloud est une solution idéale.

Publier sur le cloud une application d’analyse à partir d’une installation sur site ne suffit pas pour parler d’« analyse dans le cloud hybride ». Une vraie analyse sur le cloud hybride passe par un contrôle entièrement centralisé des données, où qu’elles se trouvent.

Lorsqu’on utilise une solution d’analyse dans le cloud hybride, ni l’emplacement des données ni le lieu de traitement des analyses ne doivent avoir d’impact pour les utilisateurs, qui doivent pouvoir accéder à la data depuis n’importe quel terminal – en fonction de leur rôle et de leurs autorisations en matière de sécurité, bien entendu. Tous les utilisateurs doivent pouvoir accéder à leur environnement et choisir les données ou applications qu’ils souhaitent visualiser et exploiter, où qu’elles se trouvent et soient traitées.

Une solution correctement gouvernée définit les règles concernant le lieu de stockage et de traitement des données et celui des analyses effectuées sur ces données. Elle intègre également des niveaux de mise en œuvre en fonction du lieu de stockage ou de la sensibilité des jeux de données et des niveaux de sécurité requis. Enfin, la gestion des autorisations et des licences entre les plateformes doit être simple. Les responsables des services informatiques vont s’intéresser à tous ces critères, qui leur permettent de garantir la sécurité de leurs données tout en conservant la flexibilité et l’évolutivité nécessaires pour assurer une utilisation en libre-service des données… dans le cloud. 

Une équation difficile, dont la résolution passe par un hub universel qui représente toutes les données auxquelles un utilisateur peut accéder. Les autorisations doivent être gérées de façon orchestrée. En outre, une solution d’analyse dans le cloud hybride doit être gérée sous un environnement homogène regroupant différentes infrastructures, via une console unique. Une console de gestion permet aussi de créer des règles de mise en œuvre concernant le lieu de stockage des données en fonction des jeux de données – notamment lorsqu’une source de données particulière est trop sensible pour quitter l’abri du pare-feu et que toutes les applications d’analyse utilisant ces données doivent être exécutées elles-aussi derrière le pare-feu.

Enfin, si l’objectif est de permettre aux  entreprises et aux utilisateurs de déplacer les données et de définir où les analyses doivent être effectuées en fonction de critères qui leurs sont propres, la solution doit permettre une migration bidirectionnelle entre différents environnements d’infrastructure. 

Résumé de façon lapidaire, presque comme s’il s’agissait d’une définition à connaître par cœur, « une solution d’analyse sur le cloud hybride doit permettre une migration bidirectionnelle entre différents environnements d’infrastructure et doit être gérée sous un environnement homogène regroupant des infrastructures différentes, via une console unique. » 

C’est sur cette règle de base que les vraies solutions d’analyse de données dans le cloud hybride devraient s’aligner. Faites vos jeux !