Christophe Legendre (DSI, LeBonCoin.fr) "Notre site Web peut supporter la publication de 1 million d'annonces par jour"

Le site d'annonces en ligne a opté pour une architecture 100% Open Source. Son infrastructure de stockage sous HP-3Par gère jusqu'à 80 000 entrées/sorties par seconde.

Pouvez-vous présenter LeBonCoin.fr en quelques mots ?

Le bon coin est un site spécialisé dans la publication de petites annonces, créé en 2006. Chaque jour, environ 500 000 annonces sont déposées. Nous sommes une filiale du groupe de presse norvégien Schibsted, et nous sommes devenus en 3 ans l'un des 15 sites les plus visités de France.
 

Sur quel environnement d'exploitation reposez-vous ?

Toute notre architecture repose sur CentOS Red Hat Community Edition. L'ensemble de notre parc logiciel est soit basé sur de l'Open Source, soit sur du développement à façon. Pour le serveur Web, nous utilisons Apache. Le choix de l'Open Source vient de notre maison-mère, Schibsted, qui s'est inspiré de ce que faisait le plus grand site d'annonces en Suède, Blocket.se, qui a fait le choix de l'Open Source. Ce qui fonctionnait très bien chez eux.

Quels avantages avez-vous tiré de l'Open Source ?

Pour répondre à notre besoin de trafic d'annonces, l'Open Source est particulièrement intéressant en terme de gestion de dimensionnement. De même, il donne une très grande satisfaction pour notre moteur de recherche. La base de données, sous PostgreSQL est aussi un très bon choix, mais engendre toutefois quelques complications.

"Nous avons surtout été préoccupés par la performance I/O plutôt que par la volumétrie"

Elle ne se révèle pas non plus aussi intuitive que cela à prendre en mains. Nous avons donc dû contourner les difficultés en faisant un gros travail sur la restructuration des tables de données et nous appuyer, dans un contexte de croissance d'annonces de 25-30% par an,  sur une partie matérielle très performante.

Quels types de matériel utilisez-vous ?

Nous avons mis en place une infrastructure de stockage full HP-3Par. Au départ, il y a 5 ans, nous avions quelques serveurs avec un peu de stockage sur disques externes, puis on a commencé à grossir. Pour faire face au traitement des données en masse, nous avons rajouté des baies de stockage attachées aux serveurs, avec 25 disques durs par MSA. A l'époque, nous avions une centaine de Go de données à traiter alors qu'aujourd'hui elles atteignent 2,8 To.
 

La gestion de la volumétrie a donc dû constituer un challenge très important pour vous ?

La principale préoccupation n'a pas tant été celle de la volumétrie que celle de la performance en entrées/sorties par seconde. A l'époque où l'on ne dépassait pas les 100 Go de stockage, on devait gérer 3 à 4 000 entrées/sorties par seconde. Aujourd'hui, on arrive à en traiter 80 000 par seconde grâce à la dernière technologie HP-3Par V800 mise en production mi-novembre.

En quoi la puissance de traitement du nombre d'entrées/sorties est-elle si importante pour vous ?

Les 500 000 annonces nouvelles rentrées par jour : il va bien falloir les écrire quelque part. Et puis il y a aussi toutes les annonces déjà présentes que les clients modifient. Il faut donc pouvoir absorber cette quantité de données. Quand je discute avec mes collègues de la profession, leur ratio d'i/o est généralement de 70% en lecture et de 30% en écriture. Or chez nous, c'est exactement l'inverse. 

"LeBonCoin.fr n'est jamais tombé"

Connaissez-vous des problèmes de montée en charge ? 

Objectivement, la montée en charge ne constitue pas pour nous un problème. Nous sommes assez fiers de notre architecture qui est bien faite. Elle est d'ailleurs capable de supporter un nombre beaucoup plus important de données. Pour atteindre les limites de l'architecture actuelle, il faudrait dépasser le million d'annonces par jour pour arriver à saturation. Nous avons encore de la marge. Sinon, entre Noël et le jour de l'an, nous subissons une petite baisse de trafic avant de remonter en janvier avec les annonces postées des déçus de Noël.


Avez-vous déjà été victime d'un dysfonctionnement majeur ?

LeBonCoin.fr n'est jamais tombé. La seule chose qui nous est arrivée a été une panne d'alimentation électrique dans l'un de nos datacenters. Comme nous fonctionnons sur une architecture dupliquée, le pire a été évité même si nous avons subi une baisse de trafic de 30%. Mais sur une vingtaine de minutes seulement.

Pour quel langage de développement avez-vous opté ?

C et PHP. Même si nous sommes en train de faire évoluer notre plate-forme technique, nous estimons que le langage C reste le meilleur et de loin en termes de performance. PHP est utilisé pour la dépose d'annonces.


Avez-vous mis en place des procédures de batch particulières ?

Nous nous sommes autorisés un mode maintenance. Il n'est donc pas possible de déposer des annonces dans la nuit. Ce laps de temps nous permet de mettre nos logiciels à jour, de corriger les bugs, d'incrémenter des nouvelles fonctions...
 

"LeBonCoin.fr sera bientôt disponible pour les terminaux Android"

C'est plutôt rare de voir des résultats de recherche en provenance de LeBonCoin.fr remonter dans Google. Y'a-t-il une explication à cela ?

Nous avons rencontré pas mal de personnes chez Google, et travaillons activement à améliorer la partie Sitemap pour doper notre référencement. Notre stratégie de référencement reste toutefois entre les mains de notre maison-mère.

Recourez-vous à de l'externalisation ?

Nous faisons appel à l'offshore uniquement pour répondre à la validation des annonces par le biais d'une société basée à Malte. Tous les projets et développements informatiques sont réalisés en France. Nos équipes en France sont localisées à Paris pour tout ce qui concerne le marketing, la technique et l'administration. Nous avons une équipe de télévendeurs pour cibler le marché Entreprises à Montceau-les-Mines.


Quelle est la taille de votre DSI ?

Sur les 100 personnes employées par LeBonCoin.fr, une quinzaine travaillent à l'informatique. Mis à part deux architectes et moi-même, tous les collaborateurs sont des développeurs.

Sur quel hébergeur vous-appuyez-vous ?

Notre point d'entrée est Illiad Entreprises. Nos données sont hébergées dans deux datacenters géographiquement distants avec réplication de données, dont l'un est géré en propre et l'autre par Neo Telecoms Equinix.
 

Où en êtes-vous dans vos projets mobiles ?

Il est possible de visualiser les annonces en mode Web depuis un iPhone. Pour la dépose, il faut en revanche utiliser une application native. Nous prévoyons une ouverture vers Android, mais je n'ai pas encore de délai à vous communiquer.


Doit-on s'attendre à des mises à jour du site prochainement ?

Des nouvelles fonctionnalités vont arriver en janvier, et le site va connaître quelques modifications dont je ne peux malheureusement rien vous dire à l'heure actuelle.

Christophe Legendre est DSI du site LeBonCoin.fr.