Ihr Browser ist veraltet. Wir empfehlen Ihnen ein Update zum Besuch unserer Website.

 

Technische Umsetzung einer Onsite-Suche mit Solr

Viele Argumente sprechen f√ľr die Investition in eine moderne Onsite-Suche: Steigerung der Conversion Rate, verbesserte User Experience und zufriedene Website-Nutzer. Doch mit welcher Software l√§sst sich eine Suchfunktion, die mehr bietet als nur eine einfache Volltextsuche, technisch realisieren? Wer eine lizenzkostenfreie Variante mit umfangreichen M√∂glichkeiten f√ľr die  Programmierung sucht, sollte sich "Apache Solr" genauer anschauen.

Individuelle Ausgestaltung mit Solr

Absoluter Pluspunkt der Solr-Suchmaschine ist die m√§chtige Abfragesprache, mit der sich die gew√ľnschten Servicefunktionen den eigenen Anforderungen entsprechend programmieren lassen. Sowohl eine einfache Suchmaschine, ausgestattet mit Basisfunktionen (etwa f√ľr klassische Nachrichtenseiten) als auch ein umfangreiches Rechercheinstrument mit erg√§nzenden Servicefunktionen (beispielsweise auf Websites von Universit√§ten oder Bibliotheken) l√§sst sich mit verh√§ltnism√§√üig geringem Aufwand umsetzen.

Da die Anforderungen an eine moderne Suchmaschine und die M√∂glichkeiten mit Solr so vielf√§ltig sind, sollte man schon in der Konzeptionsphase genau planen, welche Funktionen f√ľr die eigene Zielsetzung zweckdienlich sind und welche Features zwar technisch m√∂glich, aber nur bedingt hilfreich sind. Zu den Basisfunktionen, die jede moderne Onsite-Suche bieten sollte, z√§hlen Type Ahead, eine Rechtschreibkorrektur sowie Filter und Facettierungen.

Gewichtungen und redaktionelle Priorisierung

F√ľr Suchmaschinen, die auf sehr gro√üe und dynamische Datenmengen angewendet werden, bietet Apache Solr zus√§tzliche Programmierm√∂glichkeiten, die eine gewichtete Anzeige der Ergebnisse erlauben. So kann beispielsweise eingerichtet werden, dass Beitr√§ge und Dokumente, die besonders h√§ufig aufgerufen wurden, prominenter angezeigt werden, um die offensichtlich hilfreichen Inhalte auch f√ľr weitere Nutzer zug√§nglich zu machen. Damit verhindert wird, dass durch diese Funktionalit√§t ausschlie√ülich √§ltere Beitr√§ge, die nur aufgrund ihres Alter eine besonders hohe Klickzahl verzeichnen k√∂nnen, angezeigt werden, greift als korrigierender Faktor die Aktualit√§t des Dokumentes ein.

Auch redaktionell beeinflussbare Gewichtungen sind mit der Solr-Suchmaschine m√∂glich. Zum einen l√§sst sich f√ľr einzelne Beitr√§ge ein Gewichtungsfaktor bestimmen, sodass ihre Bedeutung k√ľnstlich erh√∂ht wird und sie eine bessere Position in der Trefferliste erhalten. Als Steigerung dieser Priorisierung steht die sogenannte Elevation-Funktion zur Verf√ľgung. Dar√ľber kann festgelegt werden, dass ein bestimmter Beitrag bei einigen Suchbegriffen grunds√§tzlich in einer Top-Position dargestellt wird. Voraussetzung f√ľr einen effizienten Workflow ist hierbei allerdings, dass die genannten Solr-Funktionen optimal in das jeweilige Content Management System integriert wurden.

Schlie√ülich k√∂nnen die bereits verwendeten Suchphrasen genutzt werden, um die Trefferliste weiter zu optimieren und Listen mit Synonymen zu pflegen, damit beispielsweise Fachbegriffe f√ľr externe Nutzer zug√§nglich gemacht werden. Ein simples Beispiel: Wer einen K√ľhlschrank kaufen m√∂chte, wird mutma√ülich auf der Website eines entsprechenden Herstellers "K√ľhlschrank" in das Suchfeld eingeben. Da der offizielle Begriff bei einigen Unternehmen aber "K√ľhlger√§t" ist, w√ľrde eine schlecht programmierte Suche keine Treffer liefern. Mit der entsprechenden Synonympflege wei√ü die Suchmaschine allerdings, wonach der Nutzer sucht und wird passende Treffer anzeigen. Auch hier gilt die oben genannte Bedingung f√ľr eine effiziente Pflege: Eine gelungene CMS-Integration ist Pflicht.

Einbinden der Ergebnisse als RSS-Feed

Mit der reinen Suchabfrage sind die M√∂glichkeiten von Apache Solr allerdings noch nicht ausgesch√∂pft. Dank der zahlreichen Schnittstellen lassen sich die Suchabfragen relativ problemlos in andere Websites einbinden, um dort die Ergebnislisten den eigenen W√ľnschen entsprechend anzuzeigen. Denkbar w√§re beispielsweise eine automatisierte Liste der zehn neuesten Beitr√§ge zu einem bestimmten Thema anzubieten. Dabei handelt es sich aus technischer Sicht um nichts weiter als einen RSS-Feed, der im √úbrigen auch zur inhaltlichen Personalisierung einer Webseite verwendet werden kann. Ein einfaches Beispiel ist die Ausgabe weiterf√ľhrender Informationen wie multimedialer Inhalte oder News, passend zur Verschlagwortung eines Artikels.

Technische Basis von Solr

Wie bei jeder Suchmaschine ist auch bei Solr der Index die Grundlage f√ľr alle weiteren Suchanfragen, Auswertungen, Gewichtungen etc. Um Inhalte in den Index zu bekommen, gibt es grunds√§tzlich zwei m√∂gliche Varianten: Crawling und Push-Indizierung. Der erstgenannte Weg wird besonders erfolgreich vom Suchmaschinengiganten Google genutzt, der regelm√§√üig den "Googlebot" durch das Internet schickt, um neue Inhalte zu finden und zu indexieren. Das Crawling eignet sich vor allem f√ľr die Indexierung von externen Websites und Daten; f√ľr Solr wird es mit der Software Nutch realisiert. Wird die Suchfunktion vorrangig f√ľr Inhalte der eigenen Website oder einer internen Anwendung verwendet, bietet sich die Push-Indizierung an, die je nach technischer Plattform in die Solr-Schnittstellen integriert wird. Werden neue Inhalte eingespielt, werden diese automatisch an den Solr-Index weitergegeben und dort f√ľr kommende Suchanfragen zur Verf√ľgung gestellt.

F√ľr die initiale Einrichtung von Solr bietet es sich an, auf das Fachwissen von Softwareentwicklern zur√ľckzugreifen, wobei der ben√∂tigte Zeitaufwand stark von den eigenen Anforderungen abh√§ngig ist. W√§hrend Suchmaschinen mit geringem Funktionsumfang verh√§ltnism√§√üig schnell umgesetzt werden k√∂nnen, bringen zus√§tzliche Servicefunktionen folglich gr√∂√üeren Aufwand. Bei umfangreicher Nutzung und vielen Anforderungen ist zus√§tzlich ein ausgereiftes inhaltliches Konzept notwendig. Sobald die einmalige Einrichtung der Solr-Suchmaschine abgeschlossen ist, reduziert sich der Pflegeaufwand in der Folge deutlich. Lediglich im Fall von redaktionellen Gewichtungen und Priorisierungen sind regelm√§√üige Anpassungen notwendig, die allerdings problemlos ohne Programmierf√§higkeiten umgesetzt werden k√∂nnen.

Fazit: Gro√üer Nutzen bei √ľberschaubarem Aufwand

Lizenzkostenfrei, umfangreiche Programmierm√∂glichkeiten, geringer Pflegeaufwand. Mit diesen drei Aspekten punktet die Solr-Suchmaschine von Apache und dr√§ngt sich als L√∂sung f√ľr die Einrichtung einer Onsite-Suche auf. Selbstverst√§ndlich gibt es auch alternative Programme, etwa ElasticSearch oder die kostenpflichtigen Intrafind und Google Search Appliance, aber die Projekterfahrung zeigt, dass mit Solr sch√∂ne Ergebnisse erzielt werden k√∂nnen. Wer mit dem Gedanken spielt, die Onsite-Suche zu optimieren, sollte Apache Solr definitiv in Erw√§gung ziehen.

Lesedauer: 4 Minuten
Kategorie
Technologie
Schlagworte
Onsite-SucheSolrApache
Autor
placeholder

Tilman Issing

Gr√ľnder & Gesch√§ftsf√ľhrer

Tilman ist Gr√ľnder von Pinuts und leidenschaftlicher IT-Experte. Immer wenn er etwas Zeit findet, gibt er im Blog sein Wissen weiter - meist mit Fokus auf technische Fragestellungen.


Lernen Sie
uns kennen

Pinuts media + science Multimedia-Agentur GmbH