Les coulisses informatiques de Twitter Bases de données : SQL et noSQL à l'honneur chez Twitter

Présent dès l'origine de la création du site en 2006, le système de gestion de base de données relationnelle Open Source MySQL est une composante clé de l'informatique de Twitter. Il assure entre autres la gestion du stockage des centaines de teraoctets de données générées par ses 500 millions d'utilisateurs.

twitter a recourt également à flockdb, une base de données graphique open source
Twitter a recourt également à FlockDB, une base de données graphique Open Source qui s'appuie sur le gestionnaire de partition de données Gizzard. © Yabresse - Fotolia.com

Depuis avril 2012, Twitter a par ailleurs décidé de reverser à la communauté Open Source (via GitHub) de nombreux développements réalisés autour de MySQL. Notamment ceux qui concernent l'optimisation de l'allocation mémoire sur systèmes NUMA (Non-Uniform Memory Access) ou serveurs SSD. 

En début d'année 2010, Twitter a annoncé vouloir migrer ses serveurs de données vers la base noSQL Cassandra : un projet soutenu par la fondation Apache.

Cette brique Open Source est aussi utilisée par des géants du Cloud comme Google, Facebook ou encore Amazon. Les raisons de ce chantier pour Twitter ? Optimiser encore les performances de la plate-forme, et améliorer sa capacité de déploiement. Aujourd'hui pourtant, Twitter a fait le choix de la cohabitation en regroupant le meilleur des deux mondes en termes de bases SQL (MySQL) et noSQL (Casandra).