Search (2 results, page 1 of 1)

  • × author_ss:"Henzinger, M."
  1. Henzinger, M.; Pöppe, C.: "Qualität der Suchergebnisse ist unser höchstes Ziel" : Suchmaschine Google (2002) 0.01
    0.007996293 = product of:
      0.03198517 = sum of:
        0.03198517 = weight(_text_:und in 851) [ClassicSimilarity], result of:
          0.03198517 = score(doc=851,freq=26.0), product of:
            0.12075608 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.054483794 = queryNorm
            0.2648742 = fieldWeight in 851, product of:
              5.0990195 = tf(freq=26.0), with freq of:
                26.0 = termFreq=26.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0234375 = fieldNorm(doc=851)
      0.25 = coord(1/4)
    
    Content
    Spektrum der Wissenschaft: Frau Henzinger, wie viele Seiten des World Wide Web erschließt Google heute? Monika Henzinger: Wir haben über zwei Milliarden Webseiten in unserer Datenbank. Hinzu kommen 700 Millionen Newsgroup-Beiträge, die weit in die Vergangenheit reichen, und 300 Millionen Bilder. - Spektrum: Und diese Inhalte haben Sie komplett gespeichert? - Henzinger: In komprimierter Form, ja. Spektrum: Ist das nicht schon das gesamte Web? - Henzinger: Bei weitem nicht! Eigentlich ist das Web unendlich. Es gibt Datenbanken, die beliebig viele Webseiten auf Anfrage erzeugen können. Natürlich macht es keinen Sinn, die alle in der Suchmaschine zu haben. Wir beschränken uns auf Seiten hoher Qualität. - Spektrum: Wie wählen Sie die aus? - Henzinger: Nach dem so genannten PageRank. Das ist eine Note, die wir jeder Seite geben, unabhängig von irgendeiner Anfrage, für die diese Seite relevant sein könnte. Und zwar ist die Qualität einer Seite - oder anders gesagt: die Hochachtung, die sie innerhalb des Web genießt - umso größer, je mehr andere Seiten auf sie verweisen und je höher die Qualität der verweisenden Seite ist. Der PageRank bestimmt auch wesentlich die Reihenfolge, in der Google dem Anfrager die Ergebnisse präsentiert. - Spektrum: Ist der PageRank manipulierbar, etwa durch ein Zitierkartell? - Henzinger: Es wird zumindest immer wieder versucht. Zum Beispiel ist "Britney Spears" ein sehr häufiger Suchbegriff. Deswegen versuchen viele, ihren PageRank hochzutreiben, um unter den Antworten auf "Britney Spears" auf den vordersten Plätzen zu landen, auch wenn sie bloß Turnschuhe verkaufen. - Spektrum: Und was tun Sie dagegen? - Henzinger: Wenn wir offensichtlichen Missbrauch sehen, nehmen wir die entsprechenden Seiten gezielt heraus - im Interesse unserer Benutzer, für die wir die Qualität wahren wollen. - Spektrum: Gibt es auch andere Maßnahmen als diese Einzelkorrekturen? - Henzinger: Ja. Aber die diskutieren wir nicht öffentlich, um den "Rüstungswettlauf" nicht anzuheizen. - Spektrum: Seit wann gibt es Google? - Henzinger: Die Firma existiert seit dreieinhalb Jahren. Seit reichlich zwei Jahren sind wir auf dem Markt. Die Kunde von uns hat sich durch Mundpropaganda verbreitet, und inzwischen kommt die Hälfte der Anfragen von außerhalb der USA, zwölf Prozent allein aus dem deutschsprachigen Raum. Wir beantworten über 150 Millionen Anfragen am Tag, und zwar direkt oder über unsere Partner. Wenn zum Beispiel die Suchmaschine Yahoo ein Stichwort nicht im eigenen Verzeichnis findet, reicht sie die Anfrage an uns weiter und gibt dem Benutzer unsere Antwort. - Spektrum: Mit welcher Hardware läuft das System? - Henzinger: Mit über zehntausend PCs, verteilt auf vier Datenzentren. Betriebssystem ist Linux. - Spektrum: Wie prüfen Sie, ob die aufgeftihrten Webseiten noch existieren? - Henzinger: Besonders ereignisreiche Webseiten besuchen wir täglich. Alle 28 Tage aktualisieren wir den Index - das ist die Liste, die zu jedem Wort die Seiten aufführt, auf denen es vorkommt. - Spektrum: Wie aufwendig ist dieses Indizieren? - Henzinger: Sehr aufwendig. Etwa eine Woche. - Spektrum: Wie viele Leute hat die Firma? - Henzinger: Ungefähr 300. Bisher haben wir unsere Belegschaft in jedem Jahr ungefähr verdoppelt. -
    Spektrum: Wie finanziert sich Google? - Henzinger: Überwiegend durch gewöhnliche Reklame: einzeilige Anzeigen, die nur aus durchlaufendem Text bestehen. Diese Werbung erscheint nur auf solche Fragewörter, die mit dem Produkt in Verbindung stehen, wir nennen das "keyword targeting". Auch kann jeder online eine Anzeige kaufen. Wenn Sie Ihrer Frau über Google zum Geburtstag gratulieren wollen, können Sie eine Anzeige schalten, die nur auf deren Namen hin erscheint. Zweitens durch Search Services. Zum Beispiel bezahlt uns Yahoo dafür, dass unsere Ergebnisse auf deren Seite erscheinen. Manche Firmen wollen auf ihrer Webseite eine Suchfunktion einrichten, aber nicht selbst programmieren. Für diese Unternehmen bauen wir dann einen eigenen Index und beantworten damit die Suchanfragen, die an sie gestellt werden. Schließlich verkaufen wir neuerdings unsere Produkte zur firmeninternen Nutzung in Intranets. Mit diesem Konzept sind wir eine der wenigen neuen Internet-Firmen, die ihr Geld verdienen. - Spektrum: Gibt es neue Projekte? - Henzinger: Zum Beispiel Spracheingabe. Der Benutzer spricht seine Frage in ein Mikrofon und bekommt die Antworten auf den Bildschirm, später vielleicht auch gesprochen. Oder unser News Search. Unsere Maschinen lesen Tageszeitungen und stellen Artikel zum gleichen Thema aus verschiedenen Ländern zusammen. Das ist interessant, weil die Berichterstattung zumeist national gefärbt ist. Ein regelmäßiger Vergleich kann den Horizont erweitern. Klicken Sie unter google.com auf "News and Resources" und dann "Check out the Google news search". Oder User Interfaces. Wie bringt man den Benutzer dazu, mehr als zwei Wörter einzutippen? Je mehr Wörter er ansagt, desto besser können wir ihn bedienen.
    Series
    Forschung und Gesellschaft
  2. Henzinger, M.; Wiesemann, M.: Google-Forschungschefin Monika Henzinger beklagt Manipulationen von Suchmaschinen : "Tricks der Porno-Branche" (2002) 0.00
    0.00295703 = product of:
      0.01182812 = sum of:
        0.01182812 = weight(_text_:und in 1137) [ClassicSimilarity], result of:
          0.01182812 = score(doc=1137,freq=2.0), product of:
            0.12075608 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.054483794 = queryNorm
            0.09795051 = fieldWeight in 1137, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.03125 = fieldNorm(doc=1137)
      0.25 = coord(1/4)
    
    Abstract
    FOCUS: Viele Menschen sind frustriert, weil sie im Internet vergebens suchen. Warum versagen Suchmaschinen so häufig? Henzinger: Gerade Netz-Neulinge formulieren Suchbegriffe falsch, fragen zu allgemein oder zu speziell. Suchmaschinen haben Schwierigkeiten, aus einem oder zwei Wörtern die Gedanken eines Nutzers abzulesen. FOCUS: Google könnte dennoch Einsteigern bei der Suche mehr helfen ... Henzinger: ... indem wir aus den täglich 150 Millionen Suchanfragen Rückschlüsse ziehen, richtig. In Zukunft könnte die Software den Nutzer fragen: Du hast "BMW" eingegeben, willst du einen Wagen kaufen, mieten oder etwas über die Technik erfahren? FOCUS: Noch allerdings muss man sich durch lange Ergebnislisten wühlen. Henzinger. Suchmaschinen können heute eine Website zwar nach einem bestimmten Wort durchsuchen, aber nicht den Sinn verstehen. In dieser Hinsicht hinkt die Entwicklung den Anforderungen der Nutzer hinterher. FOCUS: Was unternehmen Sie dagegen? Henzinger: Wir arbeiten zum Beispiel verstärkt daran, zueinander in Beziehung stehende Internet-Seiten in eine Themen-Schublade zu stecken. Die Gefahr ist jedoch, dass Homepage-Betreiber das System unterlaufen, um weit oben auf der Ergebnisliste zu landen. FOCUS: Was anscheinend schon oft passiert ist, denn Google gerät wie andere Dienste immer wieder in die Schlagzeilen, weil Suchergebnisse von außen manipuliert wurden. Henzinger: Wu beobachten eine Art Wettrüsten: Unsere Programmierer entwickeln immer kompliziertere Aufspürmechanismen; kommerzielle Anbieter versuchen, diese zu knacken. Die Pornobranche trickst am raffiniertesten. FOCUS: Auf welche Weise? Henzinger. Sie versucht etwa, unseren elektronischen Spürhund auf eine falsche Fährte zu locken: Wird der GoogleSuchroboter identifiziert, zeigen ihm Sexanbieter eine völlig harmlose Homepage an. Wenn unsere Nutzer aber später diese Seite aufrufen, landen sie auf einer Pornoseite. Es kostet uns viel Geld, diese ständigen Attacken abzuwehren. FOCUS: Auch das so genannte "unsichtbare Web"ist für Sie ein Problem. Laut Experten soll dieses 500-mal größer sein als die vergleichsweise mickrigen zwei Milliarden Websites, die die digitalen Schnüffelverfahren heutzutage erfassen können. Henzinger: Es ist bislang schwer, zum Beispiel auf wissenschaftliche Datenbanken zuzugreifen. Deren Betreiber sind aber dabei, eine Brücke zwischen Suchprogrammen und Archiven zu schlagen. Parallel dazu arbeitet Google - ähnlich wie Spezial-Dienstleister - an Mechanismen, die bei bestimmten Anfragen nur passende Quellen zum Thema durchforsten. In fünf bis zehn Jahren wird das Netz viel weiter erschlossen sein. Intelligente Suchdienste werden dann auf eine Frage nicht mehr eine Website, sondern eine im Internet recherchierte Antwort auswerfen.