Pierre Matuchet (DT, Voyages-SNCF) "La virtualisation ajoute de la complexité, ce n'est pas ce que nous voulons"

Le géant de la réservation sur Internet se repose sur une infrastructure très récemment revue, et corrigée. Au menu : simplification logicielle et technique pour atteindre la très haute disponibilité.

Quel est le périmètre de la direction technique de Voyages-SNCF ?

La direction technique est la filiale technologique du groupe SNCF. Nous travaillons sur le site Voyages-SNCF, mais aussi sur la dizaine d'autres sites du groupe, relatifs au monde ferroviaire.

Tous les sites sont hébergés dans notre centre de calcul SNCF de Lille, où nous avons entre 200 et 250 serveurs, qui sont un mélange de serveurs Sparc (ndlr. Sun Microsystems) et Intel. La direction technique est composée de 150 personnes en interne et nous faisons également appel à 150 personnes en externe.

Votre site a été fortement critiqué récemment, surtout sur la question de disponibilité. Qu'en est-il aujourd'hui ?

Le site va bien. Le 14 octobre dernier, nous avons vécu un record des ventes et un record de fréquentation. Cela a représenté 10 millions de sessions, 315 000 billets de train vendus et 3 000 messages par seconde. Il faut noter par ailleurs que 1 300 billets ont été achetés sur téléphone mobile via notre site dédié.

Donc les choses se sont améliorées. Qu'avez-vous fait pour cela ?

Nous avons beaucoup travaillé sur la notion de scalabilité. Nous avions des problèmes de montée en charge, et en un sens, nous avons été victime de notre succès. Depuis 6 mois, nous avons travaillé comme des fous pour améliorer les questions de montée en charge.

"Nous avons multiplié le nombre de serveurs physiques, et 90% de l'infrastructure technique a été changée"

Techniquement, quelles ont été les modifications que vous avez apporté ?

Nous nous sommes beaucoup penchés sur les questions de scalabilité horizontale. Concrètement, nous avons multiplié le nombre de serveurs physiques, et 90% de l'infrastructure technique a été changée pour faire face à ces problèmes. Le résultat, c'est que le 14 octobre, au moment du pic de charge le plus important de l'année, 50% de notre infrastructure seulement a été mobilisée. Donc nous avons de la marge.

A ce sujet, avez-vous songé à mettre en place des instances virtualisées ?

Sur ce point, j'ai une position très simple : la virtualisation ajoute une couche de complexité, une couche de gestion, ce qui ne correspond pas à ce que nous voulons en termes de haute disponibilité. Pour moi, la haute disponibilité, c'est le contraire de la complexité. Donc nous avons au contraire rationnalisé le code et l'infrastructure technique pour faire plus simple.

Mais cette logique amène automatiquement la multiplication de serveurs physiques. N'est ce pas un problème pour vous ?

Non, je comprends que la virtualisation soit une solution pour des sites plus petits, à la recherche de gains d'espaces et de puissance de calcul sur les serveurs. Pour notre part, nous générons un chiffre d'affaires annuel de 2,5 milliards d'euros juste un site web, donc on peut se permettre d'acheter des serveurs physiques !

Soit. Donc pas de nouvelles technologies chez vous ?

Si, nous utilisons du cloud computing chez Amazon, pour les tests et le développement des applications. Cela permet aux développeurs de monter un serveur de test en 2 minutes, et c'est un gain d'agilité considérable. Mais pour l'environnement de production, c'est vrai, nous restons sur les serveurs physiques.

"Nous avons repensé l'infrastructure de manière à gérer à chaud les mises en production."

Revenons au travail que vos équipes ont effectué pour améliorer l'accessibilité du site. La montée de version à chaud est désormais possible ?

Oui, nous avons repensé l'infrastructure de manière à gérer à chaud les mises en production. L'ancien système ne permettait pas de faire cela, et nous devions arrêter notre service pendant les opérations de mise à jour. Aujourd'hui, les sites sont divisés en deux branches, une branche avec les versions N-1 et une autre branche avec les versions N. Pour le site Voyages-SNCF, nous avons mis en production la 24ème version le 28 septembre dernier, et tout s'est bien passé au niveau du trafic et du load balancing.

Sur ce point là, qu'avez-vous modifié ?

Nous utilisons toujours à l'extérieur des serveurs Akamaï pour nos pages statiques, mais nous avons abandonné les logiciels de load balancing que nous utilisions en interne pour passer sur HAProxy. Cela nous permet de faire du load balancing de manière beaucoup plus simple, et donc de fluidifier considérablement la gestion de charge.

Vous avez donc choisi cette solution open source pour des critères de performance...

Pas seulement ! Le fait que la solution soit licenciée en open source compte également. Cela permet aux 300 développeurs qui travaillent chez nous de travailler sur le code de la solution directement, et ça c'est une vraie assurance pour nous.

Il y a-t-il donc de la place encore chez vous pour des solutions propriétaires ?

Oui certainement. Nous fonctionnons avec un mixte propriétaire et open source. Notre système de CRM est édité par Siebel par exemple, et nous ne souhaitons pas en changer ! Mais sur des couches très techniques, on se pose toujours la question de l'opportunité de l'open source.

Concernant la partie gestion de projet, comment se concrétise la relation entre la direction technique et les différentes directions métier ? Par des comités de pilotage ?

Pas du tout ! On est sur le web, il faut plus de réactivité que ce que permet un comité de pilotage. Il faut être capable de mettre ensemble des profils différents comme des développeurs techniques et des personnes du marketing. On appelle ça des core team et ça permet d'atteindre des performances, notamment en lien avec la méthode Agile. C'est une des parties pour moi les plus marrantes du job ! Ca permet des interactions courtes entre les équipes, c'est le business qui valide, et on n'est pas du tout dans un process avec un cahier des charges par exemple.

Vous parlez d'expérience puisque vous avez précédemment occupé des fonctions de directeur technique chez d'autres voyagistes. En quoi cette activité spécifique demande une gestion particulière de l'infrastructure informatique, et des compétences qui vont avec ?

Dans le monde du voyage, nous sommes dans le transactionnel à 100%. A la différnece de sites marchand comme Amazon, nos services Web doivent se connecter sur un main frame, tout en assurant de la haute disponibilité. C'est certainement ce qui fait la spécificité de notre métier.

Serveurs