Investissements d'avenir : la plateforme Big Data de TeraLab en orbite

TeraLab (Big Data pour la recherche avec VirtualScale) TeraLab a sélectionné VirtualScale pour la brique Hadoop as a Service de son projet Big Data. Des serveurs supporteront jusqu'à 300 To de données.

Lauréat de l'appel à projet Big Data lancé en 2012 dans le cadre du Programme d'investissement d'avenir, TeraLab s'apprête à sortir de terre. Cette plateforme publique de service Big Data est dédiée au secteur de la recherche, et créée à l'initiative de l'Institut Mines-Télécom et du GENES (Groupement des Ecoles Nationales d'Economie et Statistique). Sa disponibilité est en effet imminente. Elle devrait être lancée début avril.

Première et principale brique de ce projet : Hadoop as a Service. "Hadoop as a Service est la première brique d'une plateforme de Big Data plus vaste qui mettra à disposition des chercheurs une plateforme alliant puissance et performance pour éviter qu'individuellement ils montent dans leur coin un cluster. Ils pourront ainsi se concentrer sur leurs travaux en datascience et algoryhtmie plutôt que sur la mise en place d'un système informatique", explique Pierre Pleven, coordinateur du projet Teralab pour l'institut Mines-Telecom.

Au cœur du projet, c'est la solution Big Data reposant sur l'hyperviseur open source KVM de la start-up VirtualScale qui a été retenue par TeraLaba. Et ce, face à une douzaine d'offres proposées aussi bien par des généralistes du cloud que des spécialistes Big Data. Si officiellement on ne connaît pas leur noms, il se murmure que Cloudwatt, Numergy ou encore Wallix ont été approchés.  

Un projet sur 5 ans, doté d'un budget de 5,6 millions d'euros

"L'offre de VirtualScale s'est révélée être la seule véritablement prête et déployable dans l'immédiat. Elle a été aussi choisie pour ses caractéristiques avancées en termes d'élasticité, de bon rapport qualité prix et du fait qu'elle s'inscrivait parfaitement dans une stratégie d'achat innovant", indique Pierre Pleven.

S'étalant sur 5 ans, le projet Big Data de TeraLab bénéficie dans le cadre du Plan d'Investissement d'Avenir d'une enveloppe budgétaire de 5,6 millions d'euros.

La brique Hadoop as a Service n'est cependant pas la seule composante du projet. "Nous allons rentrer dans le courant du printemps dans une phase de déploiement que nous baptisons "tera memory as a service" avec la mise à disposition de serveurs dotés de 4 à 16 To de mémoire vive qui pourront gérer jusqu'à 300 To de données", précise Pierre Pleven.

Le troisième pan du projet prévu, dont le GENES est maître d'œuvre, tournera autour de la création d'un Centre d'accès sécurisé distant (CASD), une infrastructure sécurisée permettant aux chercheurs d'accéder à des bases de données très détaillées.

Serveurs / Big Data