Dossier Cinq puissants moteurs de recherche open source

On les retrouve chez Apple, Twitter, Airbus ou Dailymotion. Ce sont les moteurs de recherche parmi les plus puissants en termes de nombre de fichiers indexés, de nombre d'utilisateurs et pourtant, ils sont gratuits.

Elasticsearch : un moteur taillé pour le Big Data

C'est le moteur de recherche qui monte. Son éditeur vient de lever 104 millions de dollars auprès de New Enterprise Associates (NEA), Benchmark Capital et Index Ventures, les fonds d'investissement star de la Silicon Valley. Elasticsearch est, avec Solr, l'un des principaux moteurs de recherche issus d'Apache Lucene. Il se distingue par son fonctionnement en clusters et son interface JSON. Sa puissance le destine notamment aux applications Big Data, notamment pour réaliser des recherches dans des fichiers de log de très fortes volumétries. Elasticsearch est un moteur à structure.

L'alimentation des index Elasticsearch est assurée par un plugin, Rivers. Celui-ci permet d'indexer des documents, le contenu de bases NoSQL comme CouchDB, une queue RabbitMQ ou encore Twitter ou Wikipedia. Plus sérieusement, toutes les bases de données lui sont accessibles via son connecteur JDBC. River permet d'atteindre une indexation en quasi-temps réel des sources. Côté requête, Elasticsearch supporte la recherche par facettes ainsi que la recherche inversée (percolation) : un document nouvellement indexé va être remonté vers les utilisateurs s'il correspond à leur requête.

Elasticsearch en bref
Source : JDN
Licence Apache 2.0
Langage Java
Plateforme Toute plateforme disposant d'une machine virtuelle Java
Langages supportés .Net, Erlang, Java, JavaScript, Perl, PHP, Python, Ruby, Scala
Principaux utilisateurs Foursquare, Etsy, Mozilla, Stumbleupon, SeLoger, Viadeo, Wikimedia
Points forts / Points faibles
Source : JDN
Points fortsProcessus d'installation simplifié, architecture distribuée moderne.
Points faibles- Peu d'interfaces, hormis JSON.