Considérant que
le jazz était insuffisamment pris en compte par
les "majors", l'équipe de Jazzvalley.com
décide en 1996 de construire la plus grande base
de données au monde sur le sujet. Pour cela,
elle a développé des outils 100 %
open source de reconnaissance automatique de contenus
hétérogènes et de gestion de contenus
multilingues.
Aujourd'hui, 100.000 concerts figurent dans la base,
provenant de plus de 4000 salles et 700 festivals dans
9 pays et en 3 langues. Même chose pour 30.000
disques et 45.000 thèmes issus de 1700 labels
phonographiques.
Pour ce faire, une application complexe dénommée
"ScheduleParser" effectue une analyse sémantique
des textes bruts puis organise automatiquement les tâches
des opérateurs pour leur permettre de valider
les informations analysées.
"Les opérateurs peuvent configurer eux-mêmes
certains critères tels que la grammaire, le vocabulaire
et la connexion aux bases de données existantes",
précise Victor Zamouline, président fondateur
de Jazz Valley et développeur de la technologie.
Les
contenus analysés sont gérés en
mode multilingue
Une structure complète
d'administration multilingue et de gestion de contenu,
appelée "Multilingual Content API"
permet ensuite de produire tout ou partie d'un contenu
dynamique dans la langue spécifiée, indépendamment
du format généré. Cette application
repose sur une couche API isolée avec un jeu
exhaustif de méthodes pour la récupération
de valeurs multilingues, un modèle de stockage
de données extensible ainsi qu'une application
à interface graphique pour la coordination des
traducteurs via le réseau.
L'architecture globale suit une organisation modulaire.
Développés en Perl, les modules respectent
un modèle orienté objet et une abstraction
complète par rapport aux systèmes et applications
finales. L'utilisation intensive de mod_perl et l'accès
à l'API du serveur Apache permettent d'écrire
et de maintenir facilement des applications HTTP complexes.
Jazz Valley tourne sur tout système compatible
Unix.
Des
gains de temps prodigieux
"Grâce aux performances de nos logiciels,
il a été possible d'assurer le fonctionnement
des applications de Jazz Valley sur Internet en n'utilisant
que deux serveurs Unix construits en interne. Le système
de production, ne générant que des pages
entièrement dynamiques et personnalisées,
a servi plus d'un milliard de hits en 2 ans sans dépasser
une moyenne de 500 millièmes de secondes par
requête en temps de réponse du serveur",
ajoute Victor Zamouline.
"Sans notre technologie, l'encyclopédie
que nous avons construite aurait nécessité
de 30 à 40 personnes, au lieu de 2 dans les faits.
De même pour les 2 millions de liens récursifs
qui ont été générés
automatiquement entre les musiciens, les salles, les
festivals ou bien encore pour les 3 millions d'écrans
de présentation accessibles par nos utilisateurs
en fonction de leurs requêtes", conclut-il.
|