Apache Solr

Quelques caractéristiques

Réplication

Solr permet de faire de la réplication. Pour cela, il est nécessaire de mettre en place 1 Solr Master, serveur sur lequel sera réalisé l'indexation. Par ailleurs, plusieurs Solr Searchers (esclaves) permettant de réaliser les requêtes, doivent être synchronisés avec le Master. Pour cela, Solr utilise l'outil rsync.
Le schéma ci-dessous présente le fonctionnement de la réplication :


Source : tutorial de Yonik Seeley, 26 juin 2006

Highlighting

Cette fonctionnalité permet de mettre en surbrillance les termes recherchés. Ce principe est le même que les pages "en cache" de Google où les termes recherchés apparaissent surlignés en jaune.
C'est une fonctionnalité puissante et pratique.

SpellCheck

Solr gère le spell sheck : si des termes sont proches que certains présents au sein de documents indexés, il propose des proposition de termes à rechercher. Google dispose de la même fonctionnalité.

Facettes

Une des caractéristiques intéressantes de Solr est la gestion des facettes. Cette fonctionnalité permet de regrouper les informations par catégories. C'est de plus en plus utilisé aujourd'hui car c'est très pratique et rapide.


Source : extrait du site CNET

Importations de données

Depuis la version 1.3.0 de Solr, il est possible d'importer des données depuis une base de données ou bien un flux RSS. Cela permet d'indexer tout un ensemble de données à la fois, c'est très pratique.