Lucene et Solr 3.5 : le taux d'expansion de l'index optimisé

Gestion et analyse d'index, détection de langues... Les nouvelles versions du moteur et du serveur de recherche Open Source de la fondation Apache apportent leur lot de nouveautés.

Le projet Lucene a dévoilé les versions 3.5 de son moteur de recherche plein texte et de son serveur d'indexation et de recherche Open Source. Le premier introduit des évolutions dans son système de structuration de données qui permettent de réduire le taux d'expansion de l'index (3-5X) et donc la mémoire nécessaire.

Autres évolutions apportées à Lucene 3.5.0 : une meilleure gestion des écritures et lectures d'index, ainsi que la possibilité d'exécuter des recherches sur plusieurs fil (multithread). La gestion de plusieurs requêtes sur une même recherche est aussi facilitée, ce qui permet d'enrichir l'expérience utilisateur au sein des pages de résultats.

Solr 3.5 introduit lui aussi plusieurs nouveautés portant sur le traitement de l'index : la détection de langues au sein des documents à indexer, l'intégration du moteur de reconnaissance de langues Hunspell (qui est utilisé comme correcteur orthographique dans OpenOffice), mais également la recherche distribuée avec une classification des résultats par groupe.