Apache Solr
Introduction
Historique
C'est en 2006, que CNET fait don du code de Solr à Apache. C'est donc un produit relativement neuf. Toutefois, il est déjà utilisé sur de nombreux sites à lourds traffic tels que www.cnet.com, www.zvents.com (base d'événements) ou encore www.netflix.com (base de films).
Apache Lucene
Apache Solr est basé sur Apache Lucene, une librairie de recherche "full-text" libre, sous licence Apache. Elle a été conçue en 1999 et a été donnée à Apache en 2001. Elle est entièrement écrite en Java, mais a été portée par la suite dans différents autres langages tels que C/C++, Ruby, .NET ou Python. Le gros avantage de Lucène est qu'elle est très robuste, très stable et très performante. Dailleurs, Wikipedia est basé dessus !
Caractéristiques de Solr
Définition donnée par la communauté :
"Solr est un serveur de recherche pour entreprises, open source et basé sur la librairie Java de
recherche Lucene, avec des APIs XML/HTTP, le principe de cache, de réplication, et une interface
d’administration Web".
Etant basé sur Lucene, Solr hérite de ses puissantes propriétés.
Il est aussi écrit en Java5 et déployable facilement sous forme de Web Application (fichiers avec
l'extension .war).
La communauté qui travaille derrière Apache Solr est importante et de plus en plus nombreuse, car Solr
commence à se démocratiser. Ainsi, un grand nombre de supports sont disponibles : Wiki, Mailing list, etc.
Nécessités
Pour faire fonctionner Apache Solr, plusieurs éléments sont indispensables :
- Une machine virtuelle Java5 ou plus récente
- Un conteneur de servlets (Jetty, Tomcat, etc.). Dans l'archive téléchargée sur le site officiel, Solr est déjà configurée pour démarrer avec Jetty. Il n'y a pas de configuration spécifique à apporter.
- L'application Solr elle-même. La dernière version stable sortie à ce jour, estampilée 1.3.0, date de septembre 2008.