Technische Umsetzung einer Onsite-Suche mit Solr

Icon Apache Solr

Viele Argumente sprechen für die Investition in eine moderne Onsite-Suche: Steigerung der Conversion Rate, verbesserte User Experience und zufriedene Website-Nutzer. Doch mit welcher Software lässt sich eine Suchfunktion, die mehr bietet als nur eine einfache Volltextsuche, technisch realisieren? Wer eine lizenzkostenfreie Variante mit umfangreichen Programmiermöglichkeiten sucht, sollte sich "Apache Solr" genauer anschauen.

Individuelle Ausgestaltung der Onsite-Suche

Absoluter Pluspunkt der Solr-Suchmaschine ist die mächtige Abfragesprache, mit der sich die gewünschten Servicefunktionen den eigenen Anforderungen entsprechend programmieren lassen. Sowohl eine einfache Suchmaschine, ausgestattet mit Basisfunktionen (etwa für klassische Nachrichtenseiten) als auch ein umfangreiches Rechercheinstrument mit ergänzenden Servicefunktionen (beispielsweise auf Websites von Universitäten oder Bibliotheken) lässt sich mit verhältnismäßig geringem Aufwand umsetzen.

Da die Anforderungen an eine moderne Suchmaschine und die Möglichkeiten mit Solr so vielfältig sind, sollte man schon in der Konzeptionsphase genau planen, welche Funktionen für die eigene Zielsetzung zweckdienlich sind und welche Features zwar technisch möglich, aber nur bedingt hilfreich sind. Zu den Basisfunktionen, die jede moderne Onsite-Suche bieten sollte, zählen Type Ahead, eine Rechtschreibkorrektur sowie Filter und Facettierungen.

Gewichtungen und redaktionelle Priorisierung

Für Suchmaschinen, die auf sehr große und dynamische Datenmengen angewendet werden, bietet Apache Solr zusätzliche Programmiermöglichkeiten, die eine gewichtete Anzeige der Ergebnisse erlauben. So kann beispielsweise eingerichtet werden, dass Beiträge und Dokumente, die besonders häufig aufgerufen wurden, prominenter angezeigt werden, um die offensichtlich hilfreichen Inhalte auch für weitere Nutzer zugänglich zu machen. Damit verhindert wird, dass durch diese Funktionalität ausschließlich ältere Beiträge, die nur aufgrund ihres Alter eine besonders hohe Klickzahl verzeichnen können, angezeigt werden, greift als korrigierender Faktor die Aktualität des Dokumentes ein.

Auch redaktionell beeinflussbare Gewichtungen sind mit der Solr-Suchmaschine möglich. Zum einen lässt sich für einzelne Beiträge ein Gewichtungsfaktor bestimmen, sodass ihre Bedeutung künstlich erhöht wird und sie eine bessere Position in der Trefferliste erhalten. Als Steigerung dieser Priorisierung steht die sogenannte Elevation-Funktion zur Verfügung. Darüber kann festgelegt werden, dass ein bestimmter Beitrag bei einigen Suchbegriffen grundsätzlich in einer Top-Position dargestellt wird. Voraussetzung für einen effizienten Workflow ist hierbei allerdings, dass die genannten Solr-Funktionen optimal in das jeweilige Content Management System integriert wurden.

Schließlich können die bereits verwendeten Suchphrasen genutzt werden, um die Trefferliste weiter zu optimieren und Listen mit Synonymen zu pflegen, damit beispielsweise Fachbegriffe für externe Nutzer zugänglich gemacht werden. Ein simples Beispiel: Wer einen Kühlschrank kaufen möchte, wird mutmaßlich auf der Website eines entsprechenden Herstellers "Kühlschrank" in das Suchfeld eingeben. Da der offizielle Begriff bei einigen Unternehmen aber "Kühlgerät" ist, würde eine schlecht programmierte Suche keine Treffer liefern. Mit der entsprechenden Synonympflege weiß die Suchmaschine allerdings, wonach der Nutzer sucht und wird passende Treffer anzeigen. Auch hier gilt die oben genannte Bedingung für eine effiziente Pflege: Eine gelungene CMS-Integration ist Pflicht.

Einbinden der Ergebnisse als RSS-Feed

Mit der reinen Suchabfrage sind die Möglichkeiten von Apache Solr allerdings noch nicht ausgeschöpft. Dank der zahlreichen Schnittstellen lassen sich die Suchabfragen relativ problemlos in andere Websites einbinden, um dort die Ergebnislisten den eigenen Wünschen entsprechend anzuzeigen. Denkbar wäre beispielsweise eine automatisierte Liste der zehn neuesten Beiträge zu einem bestimmten Thema anzubieten. Dabei handelt es sich aus technischer Sicht um nichts weiter als einen RSS-Feed, der im Übrigen auch zur inhaltlichen Personalisierung einer Webseite verwendet werden kann. Ein einfaches Beispiel ist die Ausgabe weiterführender Informationen wie multimedialer Inhalte oder News, passend zur Verschlagwortung eines Artikels.

Technische Basis von Solr

Wie bei jeder Suchmaschine ist auch bei Solr der Index die Grundlage für alle weiteren Suchanfragen, Auswertungen, Gewichtungen etc. Um Inhalte in den Index zu bekommen, gibt es grundsätzlich zwei mögliche Varianten: Crawling und Push-Indizierung. Der erstgenannte Weg wird besonders erfolgreich vom Suchmaschinengiganten Google genutzt, der regelmäßig den "Googlebot" durch das Internet schickt, um neue Inhalte zu finden und zu indexieren. Das Crawling eignet sich vor allem für die Indexierung von externen Websites und Daten; für Solr wird es mit der Software Nutch realisiert. Wird die Suchfunktion vorrangig für Inhalte der eigenen Website oder einer internen Anwendung verwendet, bietet sich die Push-Indizierung an, die je nach technischer Plattform in die Solr-Schnittstellen integriert wird. Werden neue Inhalte eingespielt, werden diese automatisch an den Solr-Index weitergegeben und dort für kommende Suchanfragen zur Verfügung gestellt.

Für die initiale Einrichtung von Solr bietet es sich an, auf das Fachwissen von Softwareentwicklern zurückzugreifen, wobei der benötigte Zeitaufwand stark von den eigenen Anforderungen abhängig ist. Während Suchmaschinen mit geringem Funktionsumfang verhältnismäßig schnell umgesetzt werden können, bringen zusätzliche Servicefunktionen folglich größeren Aufwand. Bei umfangreicher Nutzung und vielen Anforderungen ist zusätzlich ein ausgereiftes inhaltliches Konzept notwendig. Sobald die einmalige Einrichtung der Solr-Suchmaschine abgeschlossen ist, reduziert sich der Pflegeaufwand in der Folge deutlich. Lediglich im Fall von redaktionellen Gewichtungen und Priorisierungen sind regelmäßige Anpassungen notwendig, die allerdings problemlos ohne Programmierfähigkeiten umgesetzt werden können.

Fazit: Großer Nutzen bei überschaubarem Aufwand

Lizenzkostenfrei, umfangreiche Programmiermöglichkeiten, geringer Pflegeaufwand. Mit diesen drei Aspekten punktet die Solr-Suchmaschine von Apache und drängt sich als Lösung für die Einrichtung einer Onsite-Suche auf. Selbstverständlich gibt es auch alternative Programme, etwa ElasticSearch oder die kostenpflichtigen Intrafind und Google Search Appliance, aber die Projekterfahrung zeigt, dass mit Solr schöne Ergebnisse erzielt werden können. Wer mit dem Gedanken spielt, die Onsite-Suche zu optimieren, sollte Apache Solr definitiv in Erwägung ziehen.


So wird Ihre Onsite-Suche perfekt

Cover Whitepaper Onsite Suche

Die Umsetzung einer Onsite-Suche kann komplex sein, mit unserem Whitepaper wird's kinderleicht.

Darin erfahren Sie

  • Top-Argumente für eine Onsite-Suche
  • einen Plan für die konkrete Umsetzung
  • Best Practices und Benchmarks

Optimieren Sie Ihre Onsite-Suche

Newsletter abonnieren

Die besten Tricks und Expertentipps für rundum erfolgreiche Webprojekte.

Folgen Sie uns ...

... und verpassen Sie nie wieder einen neuen Beitrag in unserem Blog.

Sie haben noch Fragen?

Dann kontaktieren Sie uns einfach und wir stehen sofort zur Verfügung.

Nachricht senden

×

Eine Nachricht senden...

Formular wird geladen ...

Tipps der Redaktion

Um-logo-teaser

Bieten Sie Ihren Kunden die perfekte Customer Experience

  • E-Mail-Marketing
  • Customer Interaction
  • Website-Personalisierung

Mehr Infos zur Software

×Schließen