Document (#25852)

Author
Henzinger, M.
Pöppe, C.
Title
"Qualität der Suchergebnisse ist unser höchstes Ziel" : Suchmaschine Google
Source
Spektrum der Wissenschaft. 2002, H.7, S.106
Year
2002
Series
Forschung und Gesellschaft
Content
Spektrum der Wissenschaft: Frau Henzinger, wie viele Seiten des World Wide Web erschließt Google heute? Monika Henzinger: Wir haben über zwei Milliarden Webseiten in unserer Datenbank. Hinzu kommen 700 Millionen Newsgroup-Beiträge, die weit in die Vergangenheit reichen, und 300 Millionen Bilder. - Spektrum: Und diese Inhalte haben Sie komplett gespeichert? - Henzinger: In komprimierter Form, ja. Spektrum: Ist das nicht schon das gesamte Web? - Henzinger: Bei weitem nicht! Eigentlich ist das Web unendlich. Es gibt Datenbanken, die beliebig viele Webseiten auf Anfrage erzeugen können. Natürlich macht es keinen Sinn, die alle in der Suchmaschine zu haben. Wir beschränken uns auf Seiten hoher Qualität. - Spektrum: Wie wählen Sie die aus? - Henzinger: Nach dem so genannten PageRank. Das ist eine Note, die wir jeder Seite geben, unabhängig von irgendeiner Anfrage, für die diese Seite relevant sein könnte. Und zwar ist die Qualität einer Seite - oder anders gesagt: die Hochachtung, die sie innerhalb des Web genießt - umso größer, je mehr andere Seiten auf sie verweisen und je höher die Qualität der verweisenden Seite ist. Der PageRank bestimmt auch wesentlich die Reihenfolge, in der Google dem Anfrager die Ergebnisse präsentiert. - Spektrum: Ist der PageRank manipulierbar, etwa durch ein Zitierkartell? - Henzinger: Es wird zumindest immer wieder versucht. Zum Beispiel ist "Britney Spears" ein sehr häufiger Suchbegriff. Deswegen versuchen viele, ihren PageRank hochzutreiben, um unter den Antworten auf "Britney Spears" auf den vordersten Plätzen zu landen, auch wenn sie bloß Turnschuhe verkaufen. - Spektrum: Und was tun Sie dagegen? - Henzinger: Wenn wir offensichtlichen Missbrauch sehen, nehmen wir die entsprechenden Seiten gezielt heraus - im Interesse unserer Benutzer, für die wir die Qualität wahren wollen. - Spektrum: Gibt es auch andere Maßnahmen als diese Einzelkorrekturen? - Henzinger: Ja. Aber die diskutieren wir nicht öffentlich, um den "Rüstungswettlauf" nicht anzuheizen. - Spektrum: Seit wann gibt es Google? - Henzinger: Die Firma existiert seit dreieinhalb Jahren. Seit reichlich zwei Jahren sind wir auf dem Markt. Die Kunde von uns hat sich durch Mundpropaganda verbreitet, und inzwischen kommt die Hälfte der Anfragen von außerhalb der USA, zwölf Prozent allein aus dem deutschsprachigen Raum. Wir beantworten über 150 Millionen Anfragen am Tag, und zwar direkt oder über unsere Partner. Wenn zum Beispiel die Suchmaschine Yahoo ein Stichwort nicht im eigenen Verzeichnis findet, reicht sie die Anfrage an uns weiter und gibt dem Benutzer unsere Antwort. - Spektrum: Mit welcher Hardware läuft das System? - Henzinger: Mit über zehntausend PCs, verteilt auf vier Datenzentren. Betriebssystem ist Linux. - Spektrum: Wie prüfen Sie, ob die aufgeftihrten Webseiten noch existieren? - Henzinger: Besonders ereignisreiche Webseiten besuchen wir täglich. Alle 28 Tage aktualisieren wir den Index - das ist die Liste, die zu jedem Wort die Seiten aufführt, auf denen es vorkommt. - Spektrum: Wie aufwendig ist dieses Indizieren? - Henzinger: Sehr aufwendig. Etwa eine Woche. - Spektrum: Wie viele Leute hat die Firma? - Henzinger: Ungefähr 300. Bisher haben wir unsere Belegschaft in jedem Jahr ungefähr verdoppelt. -
Spektrum: Wie finanziert sich Google? - Henzinger: Überwiegend durch gewöhnliche Reklame: einzeilige Anzeigen, die nur aus durchlaufendem Text bestehen. Diese Werbung erscheint nur auf solche Fragewörter, die mit dem Produkt in Verbindung stehen, wir nennen das "keyword targeting". Auch kann jeder online eine Anzeige kaufen. Wenn Sie Ihrer Frau über Google zum Geburtstag gratulieren wollen, können Sie eine Anzeige schalten, die nur auf deren Namen hin erscheint. Zweitens durch Search Services. Zum Beispiel bezahlt uns Yahoo dafür, dass unsere Ergebnisse auf deren Seite erscheinen. Manche Firmen wollen auf ihrer Webseite eine Suchfunktion einrichten, aber nicht selbst programmieren. Für diese Unternehmen bauen wir dann einen eigenen Index und beantworten damit die Suchanfragen, die an sie gestellt werden. Schließlich verkaufen wir neuerdings unsere Produkte zur firmeninternen Nutzung in Intranets. Mit diesem Konzept sind wir eine der wenigen neuen Internet-Firmen, die ihr Geld verdienen. - Spektrum: Gibt es neue Projekte? - Henzinger: Zum Beispiel Spracheingabe. Der Benutzer spricht seine Frage in ein Mikrofon und bekommt die Antworten auf den Bildschirm, später vielleicht auch gesprochen. Oder unser News Search. Unsere Maschinen lesen Tageszeitungen und stellen Artikel zum gleichen Thema aus verschiedenen Ländern zusammen. Das ist interessant, weil die Berichterstattung zumeist national gefärbt ist. Ein regelmäßiger Vergleich kann den Horizont erweitern. Klicken Sie unter google.com auf "News and Resources" und dann "Check out the Google news search". Oder User Interfaces. Wie bringt man den Benutzer dazu, mehr als zwei Wörter einzutippen? Je mehr Wörter er ansagt, desto besser können wir ihn bedienen.
Footnote
Ein Interview
Theme
Suchmaschinen
Object
Google

Similar documents (author)

  1. Henzinger, M.R.: Link analysis in Web information retrieval (2000) 2.38
    2.3755374 = sum of:
      2.3755374 = product of:
        4.751075 = sum of:
          4.751075 = weight(author_txt:henzinger in 926) [ClassicSimilarity], result of:
            4.751075 = score(doc=926,freq=1.0), product of:
              0.76709825 = queryWeight, product of:
                1.0934958 = boost
                9.909708 = idf(docFreq=5, maxDocs=44421)
                0.07079018 = queryNorm
              6.1935673 = fieldWeight in 926, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.909708 = idf(docFreq=5, maxDocs=44421)
                0.625 = fieldNorm(doc=926)
        0.5 = coord(1/2)
    
  2. Henzinger, M.R.: Hyperlink analysis for the Web (2001) 2.38
    2.3755374 = sum of:
      2.3755374 = product of:
        4.751075 = sum of:
          4.751075 = weight(author_txt:henzinger in 1008) [ClassicSimilarity], result of:
            4.751075 = score(doc=1008,freq=1.0), product of:
              0.76709825 = queryWeight, product of:
                1.0934958 = boost
                9.909708 = idf(docFreq=5, maxDocs=44421)
                0.07079018 = queryNorm
              6.1935673 = fieldWeight in 1008, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.909708 = idf(docFreq=5, maxDocs=44421)
                0.625 = fieldNorm(doc=1008)
        0.5 = coord(1/2)
    
  3. Dean, J.; Henzinger, M.R.: Finding related pages in the World Wide Web (1999) 1.90
    1.90043 = sum of:
      1.90043 = product of:
        3.80086 = sum of:
          3.80086 = weight(author_txt:henzinger in 284) [ClassicSimilarity], result of:
            3.80086 = score(doc=284,freq=1.0), product of:
              0.76709825 = queryWeight, product of:
                1.0934958 = boost
                9.909708 = idf(docFreq=5, maxDocs=44421)
                0.07079018 = queryNorm
              4.954854 = fieldWeight in 284, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.909708 = idf(docFreq=5, maxDocs=44421)
                0.5 = fieldNorm(doc=284)
        0.5 = coord(1/2)
    
  4. Henzinger, M.; Wiesemann, M.: Google-Forschungschefin Monika Henzinger beklagt Manipulationen von Suchmaschinen : "Tricks der Porno-Branche" (2002) 1.90
    1.90043 = sum of:
      1.90043 = product of:
        3.80086 = sum of:
          3.80086 = weight(author_txt:henzinger in 2137) [ClassicSimilarity], result of:
            3.80086 = score(doc=2137,freq=1.0), product of:
              0.76709825 = queryWeight, product of:
                1.0934958 = boost
                9.909708 = idf(docFreq=5, maxDocs=44421)
                0.07079018 = queryNorm
              4.954854 = fieldWeight in 2137, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.909708 = idf(docFreq=5, maxDocs=44421)
                0.5 = fieldNorm(doc=2137)
        0.5 = coord(1/2)
    
  5. Pöppe, C.: Späte Rehabilitation des Data Encryption Standard (1993) 1.82
    1.8168141 = sum of:
      1.8168141 = product of:
        3.6336281 = sum of:
          3.6336281 = weight(author_txt:pöppe in 7581) [ClassicSimilarity], result of:
            3.6336281 = score(doc=7581,freq=1.0), product of:
              0.6415297 = queryWeight, product of:
                9.06241 = idf(docFreq=13, maxDocs=44421)
                0.07079018 = queryNorm
              5.664006 = fieldWeight in 7581, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.06241 = idf(docFreq=13, maxDocs=44421)
                0.625 = fieldNorm(doc=7581)
        0.5 = coord(1/2)
    

Similar documents (content)

  1. Lewandowski, D.: Start der eigenen Suchmaschine als Beta-Version (2004) 0.91
    0.91188806 = sum of:
      0.91188806 = product of:
        1.3678321 = sum of:
          0.19441749 = weight(abstract_txt:google in 4299) [ClassicSimilarity], result of:
            0.19441749 = score(doc=4299,freq=1.0), product of:
              0.29001987 = queryWeight, product of:
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.054079194 = queryNorm
              0.6703592 = fieldWeight in 4299, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.125 = fieldNorm(doc=4299)
          0.29926237 = weight(abstract_txt:qualität in 4299) [ClassicSimilarity], result of:
            0.29926237 = score(doc=4299,freq=1.0), product of:
              0.38663897 = queryWeight, product of:
                1.1546196 = boost
                6.192079 = idf(docFreq=246, maxDocs=44421)
                0.054079194 = queryNorm
              0.7740099 = fieldWeight in 4299, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.192079 = idf(docFreq=246, maxDocs=44421)
                0.125 = fieldNorm(doc=4299)
          0.33326936 = weight(abstract_txt:suchmaschine in 4299) [ClassicSimilarity], result of:
            0.33326936 = score(doc=4299,freq=1.0), product of:
              0.41540125 = queryWeight, product of:
                1.1967957 = boost
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.054079194 = queryNorm
              0.802283 = fieldWeight in 4299, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.125 = fieldNorm(doc=4299)
          0.5408828 = weight(abstract_txt:suchergebnisse in 4299) [ClassicSimilarity], result of:
            0.5408828 = score(doc=4299,freq=1.0), product of:
              0.57368433 = queryWeight, product of:
                1.4064445 = boost
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.054079194 = queryNorm
              0.94282305 = fieldWeight in 4299, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.125 = fieldNorm(doc=4299)
        0.6666667 = coord(4/6)
    
  2. Weber, K.: Search engine bias (2011) 0.86
    0.85507745 = sum of:
      0.85507745 = product of:
        1.2826161 = sum of:
          0.19441749 = weight(abstract_txt:google in 1351) [ClassicSimilarity], result of:
            0.19441749 = score(doc=1351,freq=4.0), product of:
              0.29001987 = queryWeight, product of:
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.054079194 = queryNorm
              0.6703592 = fieldWeight in 1351, product of:
                2.0 = tf(freq=4.0), with freq of:
                  4.0 = termFreq=4.0
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.0625 = fieldNorm(doc=1351)
          0.21161045 = weight(abstract_txt:qualität in 1351) [ClassicSimilarity], result of:
            0.21161045 = score(doc=1351,freq=2.0), product of:
              0.38663897 = queryWeight, product of:
                1.1546196 = boost
                6.192079 = idf(docFreq=246, maxDocs=44421)
                0.054079194 = queryNorm
              0.5473076 = fieldWeight in 1351, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                6.192079 = idf(docFreq=246, maxDocs=44421)
                0.0625 = fieldNorm(doc=1351)
          0.40816993 = weight(abstract_txt:suchmaschine in 1351) [ClassicSimilarity], result of:
            0.40816993 = score(doc=1351,freq=6.0), product of:
              0.41540125 = queryWeight, product of:
                1.1967957 = boost
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.054079194 = queryNorm
              0.982592 = fieldWeight in 1351, product of:
                2.4494898 = tf(freq=6.0), with freq of:
                  6.0 = termFreq=6.0
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.0625 = fieldNorm(doc=1351)
          0.46841827 = weight(abstract_txt:suchergebnisse in 1351) [ClassicSimilarity], result of:
            0.46841827 = score(doc=1351,freq=3.0), product of:
              0.57368433 = queryWeight, product of:
                1.4064445 = boost
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.054079194 = queryNorm
              0.8165087 = fieldWeight in 1351, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.0625 = fieldNorm(doc=1351)
        0.6666667 = coord(4/6)
    
  3. Bohlen, J.T.: ChemGuide und PublishersGuide : Neue spezialisierte Internet-Suchmaschinen des FIZ Chemie Berlin (2000) 0.61
    0.6113868 = sum of:
      0.6113868 = product of:
        1.2227736 = sum of:
          0.2618546 = weight(abstract_txt:qualität in 6236) [ClassicSimilarity], result of:
            0.2618546 = score(doc=6236,freq=1.0), product of:
              0.38663897 = queryWeight, product of:
                1.1546196 = boost
                6.192079 = idf(docFreq=246, maxDocs=44421)
                0.054079194 = queryNorm
              0.6772587 = fieldWeight in 6236, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.192079 = idf(docFreq=246, maxDocs=44421)
                0.109375 = fieldNorm(doc=6236)
          0.2916107 = weight(abstract_txt:suchmaschine in 6236) [ClassicSimilarity], result of:
            0.2916107 = score(doc=6236,freq=1.0), product of:
              0.41540125 = queryWeight, product of:
                1.1967957 = boost
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.054079194 = queryNorm
              0.70199764 = fieldWeight in 6236, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.109375 = fieldNorm(doc=6236)
          0.66930836 = weight(abstract_txt:suchergebnisse in 6236) [ClassicSimilarity], result of:
            0.66930836 = score(doc=6236,freq=2.0), product of:
              0.57368433 = queryWeight, product of:
                1.4064445 = boost
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.054079194 = queryNorm
              1.166684 = fieldWeight in 6236, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.109375 = fieldNorm(doc=6236)
        0.5 = coord(3/6)
    
  4. Sadrozinski, J.: Suchmaschinen und öffentlich-rechtlicher Onlinejournalismus am Beispiel tagesschau.de (2007) 0.60
    0.5960722 = sum of:
      0.5960722 = product of:
        0.8941083 = sum of:
          0.30740103 = weight(abstract_txt:google in 1375) [ClassicSimilarity], result of:
            0.30740103 = score(doc=1375,freq=10.0), product of:
              0.29001987 = queryWeight, product of:
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.054079194 = queryNorm
              1.0599309 = fieldWeight in 1375, product of:
                3.1622777 = tf(freq=10.0), with freq of:
                  10.0 = termFreq=10.0
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.0625 = fieldNorm(doc=1375)
          0.14963119 = weight(abstract_txt:qualität in 1375) [ClassicSimilarity], result of:
            0.14963119 = score(doc=1375,freq=1.0), product of:
              0.38663897 = queryWeight, product of:
                1.1546196 = boost
                6.192079 = idf(docFreq=246, maxDocs=44421)
                0.054079194 = queryNorm
              0.38700494 = fieldWeight in 1375, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.192079 = idf(docFreq=246, maxDocs=44421)
                0.0625 = fieldNorm(doc=1375)
          0.16663468 = weight(abstract_txt:suchmaschine in 1375) [ClassicSimilarity], result of:
            0.16663468 = score(doc=1375,freq=1.0), product of:
              0.41540125 = queryWeight, product of:
                1.1967957 = boost
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.054079194 = queryNorm
              0.4011415 = fieldWeight in 1375, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.0625 = fieldNorm(doc=1375)
          0.2704414 = weight(abstract_txt:suchergebnisse in 1375) [ClassicSimilarity], result of:
            0.2704414 = score(doc=1375,freq=1.0), product of:
              0.57368433 = queryWeight, product of:
                1.4064445 = boost
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.054079194 = queryNorm
              0.47141153 = fieldWeight in 1375, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.0625 = fieldNorm(doc=1375)
        0.6666667 = coord(4/6)
    
  5. Hummingbird Neuer Suchalgorithmus bei Google (2013) 0.56
    0.5595856 = sum of:
      0.5595856 = product of:
        1.1191711 = sum of:
          0.3645328 = weight(abstract_txt:google in 3520) [ClassicSimilarity], result of:
            0.3645328 = score(doc=3520,freq=9.0), product of:
              0.29001987 = queryWeight, product of:
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.054079194 = queryNorm
              1.2569236 = fieldWeight in 3520, product of:
                3.0 = tf(freq=9.0), with freq of:
                  9.0 = termFreq=9.0
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.078125 = fieldNorm(doc=3520)
          0.4165867 = weight(abstract_txt:suchmaschine in 3520) [ClassicSimilarity], result of:
            0.4165867 = score(doc=3520,freq=4.0), product of:
              0.41540125 = queryWeight, product of:
                1.1967957 = boost
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.054079194 = queryNorm
              1.0028538 = fieldWeight in 3520, product of:
                2.0 = tf(freq=4.0), with freq of:
                  4.0 = termFreq=4.0
                6.418264 = idf(docFreq=196, maxDocs=44421)
                0.078125 = fieldNorm(doc=3520)
          0.33805174 = weight(abstract_txt:suchergebnisse in 3520) [ClassicSimilarity], result of:
            0.33805174 = score(doc=3520,freq=1.0), product of:
              0.57368433 = queryWeight, product of:
                1.4064445 = boost
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.054079194 = queryNorm
              0.5892644 = fieldWeight in 3520, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.5425844 = idf(docFreq=63, maxDocs=44421)
                0.078125 = fieldNorm(doc=3520)
        0.5 = coord(3/6)