James, M.
Suchmaschine mit Mehrwert : Mirago
Information - Wissenschaft und Praxis. 55(2004) H.2, S.112
Derzeit tummelt sich eine Vielzahl von Anbietern auf dem Markt für kommerzielle Suchdienste im Internet. Dieser scheint unter den Schwergewichten wie Google, Overture und Espotting aufgeteilt. Doch auch kleinere Unternehmen können sich gegen die Big Player behaupten. Voraussetzung ist ein deutlich erkennbarer Mehrwert. Zu diesen Anbietern zählt das englische Technologieunternehmen Mirago. Das Unternehmen hat sich darauf spezialisiert, riesige Datenmengen zu indexieren und hat dazu eine Reihe von Softwarelösungen entwickelt, die tiefe, organische Webindexe generieren. Attraktive Lösungen für effizientes Online-Marketing runden das Unternehmensportfolio ab. Mirago ist in Großbritannien mit einer Robot-Datenbank von mehr als 100 Millionen britischen Webseiten der größte Suchindex. Mit annähernd zwei Million Suchanfragen täglich zählt das Technologieunternehmen dort zu den zehn größten Suchmaschinen. Seit Mai 2003 betreibt Mirago auch eine Suchmaschine für Deutschland mit einem Suchindex von mehr als 100 Millionen Webseiten. Dank einer eigenen Lösung liefert Mirago in Großbritannien auch Suchergebnisse mit regionaler Eingrenzung. Dieser Service wird in naher Zukunft auch in Deutschland angeboten. Um seinen Index bereitzustellen, nutzt Mirago in seinem Operation Center Zoo Oueryserver mit 400 Gigabytes RAM. Die Systeme sind über eine 100 mbps Glasfaserkabelverbindung an das World Wide Web angeschlossen. Eine Cluster Software Architektur ist die Grundlage für die Mirago Suchmaschine und ermöglicht die parallele Arbeit mit mehreren Workstations in hoher Geschwindigkeit. Zudem wird das System äußerst skalierbar und robust.
Basis der Indexierung ist Miragos Robot "Heinrich". Heinrichs Aufgabe ist es, sich wie ein Webbrowser zu verhalten und Webseiten zu lesen. Bei der Indexierung wird der Inhalt der Seiten analysiert, das Thema bestimmt und der Text mit Links entnommen. Anschließend werden die so gesammelten Informationen in durchsuchbare Indexe umgewandelt. Dabei beachtet Heinrich sowohl das robot.txt-Protokoll als auch die Robot "noindex" und "nofollow" Meta Commands. Sobald die Indexe erstellt sind werden sie an Q3, das Mirago Ouery System, weitergegeben. Wie auch andere führende Suchmaschinen indexiert Mirago dabei mehr als nur die Worte auf einer Seite. Beinahe ohne Ausnahme benutzen die großen Suchmaschinen die Links zwischen Seiten wie auch den Text auf diesen Links, um die Wichtigkeit einer Webseite und ihre Rankingposition zu bestimmen. Mirago geht einen Schritt weiter, indem weiterführende Links der jeweiligen Seiten zur Bestimmung der Relevanz hinzugezogen werden. Sind die weiterführenden Seiten themenverwandt, so wird die Relevanz der Ursprungsseite automatisch höher eingestuft. Auch rechnet Miragos Technologie die Aktualisierungsfrequenz der Seiten mit ein und berücksichtigt, wie tief die relevanten Informationen in der Seite verborgen sind. Q3 ermöglicht es außerdem, Informationen zu suchen, die aus Datenbanksystemen stammen. Diese enthalten dynamische Inhalte, die von herkömmlichen Robots wie Heinrich nicht gelesen und damit nicht in den Webindex aufgenommen werden können. Über ein Trusted Feeds Programm, das von ausgesuchten Resellern verwaltet wird, können Sites mit dynamischen Inhalten wie Jobbörsen oder Auktionen, ihre Daten zur automatischen Aufnahme in Miragos durchsuchbaren Index übermitteln. Durch einen separaten Robot werden diese Feeds indexiert und unabhängig vom normalen Webindex tagtäglich aktualisiert.

