Snowflake, une licorne dans le big data propulsée par des Français

Snowflake, une licorne dans le big data propulsée par des Français Créée par deux anciens d'Oracle, la start-up californienne commercialise un entrepôt de données "as a service". Sa dernière levée de fonds la valorise 1,5 milliard de dollars.

Avec le cloud, tout service informatique peut devenir une commodité, un service. Le concept de data warehouse que l'on croyait relégué aux oubliettes de histoire de l'informatique avec l'essor du big data ne fait pas exception à la règle. En proposant un data warehouse en mode cloud, Snowflake a remis l'entrepôt de données au goût du jour. Alors que par le passé seules les très grandes entreprises pouvaient s'offrir ce type de plateforme, la start-up californienne entend rendre la solution accessible aux sociétés de taille modeste. Une promesse qui a fait tilt. Le nombre des clients de Snowflake a progressé de 300% en 2017 pour dépasser les 1 200. Parmi ses références, l'éditeur de San Mateo revendique Adobe, Capital One, Deliveroo, Hotel Tonight, Logitech, Nielsen ou encore Sony Pictures. La société se donne les moyens de ses ambitions. En janvier dernier, elle a levé 263 millions de dollars auprès de fonds prestigieux comme Sequoia Capital, Madrona Ventures ou Redpoint Ventures. Depuis sa création en 2012, Snowflake a rassemblé un total de 473 millions de dollars, et hissé sa valorisation à 1,5 milliard de dollars.

Benoît Dageville et Thierry Cruane, fondateurs de Snowflake. © Snowflake

A l'origine de cette belle licorne, on trouve deux Français : Thierry Cruanes qui occupe le poste d'architecte, et Benoît Dageville, celui de chief technical officer (CTO). Un autre Français, Thibaut Ceyrolle, a en charge le développement de la société en Europe. L'idée de Snowflake a germé chez Oracle où Benoît Dageville a travaillé 16 ans et Thierry Cruanes 13 ans. Au tournant des années 2010, les deux hommes comprennent que l'arrivée d'Hadoop et plus généralement de la gestion des données massivement distribuées va changer le secteur en profondeur. "Hadoop offrait la capacité d'ingérer de très forts volumes de données à des tarifs très bas comparé aux plateformes d'Oracle et Teradata", se souvient Thierry Cruanes.

Les fondateurs de Snowflake se sentent néanmoins frustrés par l'approche "primitive" d'Hadoop face à l'apport d'un data warehouse traditionnel. "Il y avait un hiatus entre cette tendance forte du marché et la réponse à apporter", poursuit Thierry Cruanes. Portant une vision différente de celle de leur employeur, les deux hommes quittent Oracle pour fonder Snowflake. Ils s'installent à quelques kilomètres, à San Mateo, dans la baie de San Francisco.

Le pari ? Construire une plateforme analytique nativement cloud. Le nuage offrira aux clients un nombre quasi-infini de ressources et une élasticité sans pareil, et ce en leur évitant d'avoir à provisionner et administrer des machines. De quoi démocratiser l'accès à un tel service pour le business. "Jusqu'alors, les entrepôts de données étaient l'apanage de l'informatique. Pour accéder à ces bunkers, les départements métier devaient montrer patte blanche alors que ce sont eux qui apportent de la valeur à la donnée", argue Thierry Cruanes faisant le parallèle avec le monde du CRM qui était "fermé jusqu'à l'arrivée de Salesforce". Autre avantage mis en avant par Snowflake  : une fois les données stockées dans le nuage, y accéder est grandement facilité. "Le marketing et la finance peuvent mener en parallèle des expérimentations sur un même jeu de données avec des ressources physiques différentes", souligne Thierry Cruanes.

Schéma d'architecture de la plateforme de Snowflake. © Snowflake

Snowflake prend en charge les données structurées et semi-structurées aux formats JSON, Avro ou XML et le traitement relationnel ACID. La plateforme dispose par ailleurs de connecteurs ODBC / GDBC et intègre nativement Apache Spark et l'environnement R. Pour l'heure, elle est uniquement hébergée sur Amazon Web Services, à travers trois zones AWS aux Etats-Unis, deux en Europe et une en Australie. La start-up envisage cependant d'étendre son offre à d'autres clouds, tels que Microsoft Azure ou Google Cloud Platform. "Il s'agit juste d'une décision commerciale à prendre", explique Thierry Cruanes.

Grâce aux fonds levés, Snowflake s'est implanté à Londres, Munich et Amsterdam, et accélère son expansion en Asie-Pacifique et en Amérique du Nord. Un bureau a été ouvert à Paris en novembre 2017. Il comprend une dizaine de collaborateurs, un nombre appelé à tripler d'ici la fin de l'année. Dans le monde, l'effectif de Snowflake dépasse les 350 personnes et devrait là encore doubler ou tripler en 2018. La société entend notamment étoffer sa force de vente. "Nous sommes une petite compagnie avec de gros concurrents qui s'appellent Google, Microsoft ou Oracle", rappelle Thierry Cruanes.

"Beaucoup de nos clients sont des multinationales qui ont besoin des mêmes données sur différents continents avec des taux de disponibilité élevés"

Snowflake prévoit également de doubler sa capacité en R&D en renforçant ses équipes d'ingénierie sur ses sites de San Mateo, ainsi qu'à Bellevue dans l'état de Washington. Sur ce terrain, l'éditeur a initié deux grands chantiers. Le premier consiste à enrichir sa plateforme de "data sharing"permettant aux entreprises d'échanger des données voire de les monétiser. Quant au second, il porte sur la mise en place d'un cloud global conçu pour répliquer des data warehouse sur différentes plaques géographiques. "Beaucoup de nos clients sont des multinationales qui ont besoin des mêmes données sur plusieurs continents avec des taux de disponibilité élevés", indique Thierry Cruanes.

Snowflake livre une nouvelle version toutes les semaines. "En cinq ans, nous aurons sorti 250 versions de Snowflake", se félicite Thierry Cruanes. "Notre offre est dix fois plus rapide que les plateformes traditionnelles de data warehouse, et réduit les coûts d'infrastructure et d'administration de 65 à 80%."

Dans le dernier quadrant magique de Gartner sur les solutions de data management pour l'analytique, paru en février, Snowflake demeure néanmoins classé parmi les "challengers". Le cabinet d'études salue la facilité de déploiement de la plateforme, ainsi que ses performances sur les très fortes volumétries de données. Aux côtés d'un hébergement limité à AWS (une situation on l'a vu appelée à évoluer), Gartner regrette qu'il faille nécessairement charger les données dans Snowflake. Une opération qui se révélerait coûteuse. Le manque de prédictibilité des coûts est l'autre grief avancé, la facturation reposant sur la puissance de calcul et l'espace de stockage consommés. L'adoption récemment annoncée par Snowflake d'une facturation à la seconde devrait permettre une meilleure maîtrise des coûts à l'avenir, reconnait Gartner.

Dans le dernier quadrant magique des offres de data management pour l'analytique de Gartner, Snowflake est classé parmi les "challengers". © Snowflake