Mit Open Source zur Unternehmenssuche

Verfasst von Thomas Schieke am 14.04.2009 - 09:56

Wenn man Mitarbeiter fragt, wie die Suchfunktion im eigenen Intranet gestaltet sein sollte, ist die Antwort in aller Regel: «So wie Google.» Damit ist die hohe Nutzerzufriedenheit im täglichen Gebrauch der Suchmaschine gemeint: Die Eingabemaske ist simpel, die Suchergebnisse erscheinen in Millisekunden und sind übersichtlich präsentiert – ein De-facto-Standard. Suchanfragen werden meist intuitiv gestellt, der Suchende nähert sich dem Ziel per Trial-and-Error.

Die Verfügbarkeit von Informationen ist Voraussetzung dafür, dass im Wertschöpfungsprozess der modernen Wissensgesellschaft Wissen generiert wird. Der stetig wachsende Datenbestand verursacht nicht nur direkte, sondern auch indirekte Kosten durch den steigenden Suchaufwand. Es ist daher naheliegend, den Zeitaufwand bei der Informationsbeschaffung zu minimieren und damit die Effizienz zu steigern.

Eine unternehmensinterne Suche kann aber keinesfalls mit der Google-Websuche gleichgesetzt werden. Technische Voraussetzungen und organisatorische Anforderungen verlangen nach anderen Lösungen. Beispielsweise besteht die Notwendigkeit, dezentrale Datenquellen in vielen unterschiedlichen Anwendungen (CMS, CRM, DMS, ERP, Fileserver, weitere Datenbanken etc.) in einem zentralen Suchindex zu vereinen. Ferner darf nicht jeder Mitarbeiter auf alle Unternehmensdaten Zugriff haben.

Die Vorstellung, eine «Plug-and-Play»-Lösung für die Unternehmenssuche zu finden, ist so verführerisch wie falsch. Es führt kein Weg an der Analyse der bestehenden IT-Infrastruktur und am Aufbau eines massgeschneiderten Suchsystems vorbei. Bevor hierfür Geld in Lizenzkosten investiert wird, lohnt sich ein Blick auf ausgereifte Open-Source-Lösungen.

Lucene ist ein Projekt der Apache Software Foundation. Die in Java entwickelte Open Source Search Library ist schnell, erweiterbar­
und skalierbar und stellt die Kernfunktionalität für die Suche bereit. Weitere für Enterprise Search unerlässliche Funktionen steuert das Apache-Projekt Solr bei. Der Such-Server wartet mit Sahnestücken auf wie Suchbegriff-Highlighting, Verfeinerung der Abfrage (Facetten-Suche respektive Drill-Down) oder phonetische und Relevanz-basierte Suche. Damit kann eine benutzerfreundliche und trotzdem mächtige unternehmensinterne Suche aufgebaut werden.

Zum Aufbau des zentralen Suchindex werden Crawler und Konnektoren benötigt. Sofern die Daten in wohldefinierten Formaten vorliegen, sind sie schnell indiziert. Nur in den seltensten Fällen ist dies jedoch der Fall, und spezifische Ansätze und Lösungen sind gefragt. Dies entschärft den Nachteil, dass Lucene/Solr nur wenig Hilfestellung durch Crawler und Konnektoren bietet.

Die Technologiewahl darf aber nicht der erste Schritt in einem Enter­prise-Search-Projekt sein. Am Anfang steht der Benutzer mit seinen Anforderungen und Informationsbedürfnissen im Mittelpunkt. Er
legt die Messlatte für die spätere Ergebnisevaluation fest. «So wie Google!» wäre damit eine gute Überschrift zum Thema Search Usability des Konzeptionsdokuments, aber auch nicht mehr.

Der Autor ist Mitinhaber von YMC AG, Anbieterin von Web-2.0-
basierten Social-Media-Applikationen.

Thomas Schieke