Document (#36340)

Author
Schmidt, V.
Title
Gut kombiniert, Watson : Was ist so schwer daran, ein Quiz zu gewinnen, wenn man die komplette Wikipedia im Kopf hat? Die FR erklärt den Jeopardy-Sieg
Source
Frankfurter Rundschau. Nr.41 vom 18.2.2011, S.2-3
Year
2011
Series
Thema des Tages
Content
"- Was steckt hinter Watson? Physisch besteht der Kandidat aus einem Raum voller Server mit fast 3000 Prozessorkernen und 15 Terabyte Speicher, einem Roboterarm, der den Knopf im Studio drückt, und einem Bildschirm mit einer visuellen Darstellung der Rechnerprozesse. - Was weiß Watson? Im Speicher stecken jede Menge Nachschlagewerke, Fachlexika und die komplette Wikipedia, die letzten zehn Jahrgänge der New York Times, Sammlungen von Zitaten und Sprichwörtern, Weltliteratur wie die Theaterstücke Shakespeares und einige Übersetzungen der Bibel. Internet-Zugang hatte Watson während der Show nicht. - Bei so viel Wissen war doch klar, dass Watson gewinnt, oder? Nein. Bei Jeopardy sind die Hinweise auf die Lösung mehrdeutig, ironisch, sprachlich komplex. Anders gesagt: Sie sind in einer Weise formuliert, die Menschen locker verstehen - mit der Computer aber Schwierigkeiten haben. Watsons wichtigste Fähigkeit ist Sprachanalyse. - Wie kann denn ein Computer Wortspiele knacken? Konstruieren wir mal so eine Jeopardy-Aufgabe: "Dieser Frédéric flog auf dem Flügel durch Paris." Um die passende Frage zur vorgebenen Antwort zu finden, muss Watson zunächst aus der als Textdatei übermittelten Aufgabe herausfinden, welche Wörter die entscheidenden Hinweise sind, und erkennen, dass mit "dieser" wohl der Nachname eines "Frédérics" gesucht wird. Rund 1000 unterschiedliche Analyse-Algorithmen laufen über den Text. Aus dem Kontext ermittelt Watson auch, dass zwar "flog" zu "Flügel" im Sinne von Körperteil eines Vogels passt, er aber mit den Begriffen "Frédéric", "Paris" und "Flügel" Ergebnisse bekommt, die mit Ornithologie nichts zu tun haben.
- Wie kommt die Antwort zustande? Die Techniker haben die Maschine mit zehntausenden früheren Jeopardy-Aufgaben gefüttert, aus denen das System "lernte", welche Algorithmen welche Art von Fragen am besten beantworten. Auf dieser Basis durchsucht Watson seine Texte und stellt bis zu 200 Hypothesen auf. - Wie sucht der Rechner die richtige Antwort aus? Watson klopft mit rund 100 Methoden seine Hypothesen ab, unter anderem, indem er den Text bewertet, der die gefundenen Suchwörter umgibt, und weitere Quellen sucht. Sagen wir, er hat einen "Frédéric" entdeckt, der "Chopin" heißt, und Zeitungsrezensionen gefunden über Leute, die "Chopin" auf dem "Flügel" spielen. Dann sucht er in seiner Datenbank nach "Frédéric Chopin Paris". Findet er Treffer in vertrauenswürdigen Quellen, etwa Enzyklopädien, bekommt die Antwort eine gute Bewertung. Die drei Hypothesen mit den meisten Prozentpunkten wurden in der Show für die Zuschauer sichtbar auf dem Bildschirm angezeigt. - Wann drückt Watson auf den Knopf? Bei Jeopardy wird bestraft, wer falsche Antworten gibt. Deshalb meldet sich Watson nur dann für eine Antwort, wenn er sich einigermaßen sicher ist, das heißt, die Bewertung über einem definierten Schwellenwert liegt. Ist er zu niedrig, merkt der Computer: Womöglich habe ich die Frage nicht verstanden, oder die Information ist nicht zuverlässig genug. Watson weiß, wann er zu wenig weiß.
- Was also ist neu an Watson? Im Prinzip nichts. Die verwendeten Techniken zur Sprachanalyse, für Suchmaschinen und Datenbanken gab es für sich genommen schon vorher. Die IBM-Techniker haben die Techniken aber nun clever kombiniert und auf leistungsstarke Rechner gepackt, die viele Operationen parallel und dadurch rasend schnell ausführen können. - Warum tritt Watson nicht gegen andere Rechner an? IBM hat aus früheren Jeopardy-Shows ermittelt, dass das kombinierte Wissen zweier menschlicher Spieler reicht, um rund 85 bis 90 Prozent der Fragen zu beantworten. Selbstbewusst schreiben die Techniker: "IBM hat dieses Leistungsniveau noch bei keinem anderen Computersystem gesehen. Andere Firmen mögen an ähnlichen Techniken arbeiten, aber derzeit sind die besten menschlichen Jeopardy-Spieler die Leute, die man schlagen muss." - Warum heißt Watson Watson? Der Anklang an Doktor Watson, den Assistenten von Sherlock Holmes mag gewollt sein, aber das eigentliche Vorbild trägt keinen Doktortitel. Thomas J. Watson war von 1914 bis 1956 IBM-Präsident."
Footnote
Vgl. unter: http://www.fr-online.de/digital/gut-kombiniert--watson/-/1472406/7205862/-/index.html. Vgl. auch die anderen Beiträge zum Thema in derselben Ausgabe.
Field
Informatik
Object
Watson

Similar documents (author)

  1. Schmidt, A.F.: Vorschläge für eine partielle Modifikation der Dezimalklassifikation - dargestellt im Rahmen einer Kurzbeschreibung der DK (1987) 4.26
    4.258803 = sum of:
      4.258803 = weight(author_txt:schmidt in 226) [ClassicSimilarity], result of:
        4.258803 = score(doc=226,freq=1.0), product of:
          0.99999994 = queryWeight, product of:
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.14675483 = queryNorm
          4.2588034 = fieldWeight in 226, product of:
            1.0 = tf(freq=1.0), with freq of:
              1.0 = termFreq=1.0
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.625 = fieldNorm(doc=226)
    
  2. Schmidt, R.: Sachkatalogisierung nach den Regeln für den Schlagwortkatalog (RSWK) aus der Sicht eines bayerischen Fachreferenten (1990) 4.26
    4.258803 = sum of:
      4.258803 = weight(author_txt:schmidt in 246) [ClassicSimilarity], result of:
        4.258803 = score(doc=246,freq=1.0), product of:
          0.99999994 = queryWeight, product of:
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.14675483 = queryNorm
          4.2588034 = fieldWeight in 246, product of:
            1.0 = tf(freq=1.0), with freq of:
              1.0 = termFreq=1.0
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.625 = fieldNorm(doc=246)
    
  3. Schmidt, S.: Anmerkungen zur Aufstellung und Erschließung von Beständen in Öffentlichen Bibliotheken und in Hochschulbibliotheken (1987) 4.26
    4.258803 = sum of:
      4.258803 = weight(author_txt:schmidt in 547) [ClassicSimilarity], result of:
        4.258803 = score(doc=547,freq=1.0), product of:
          0.99999994 = queryWeight, product of:
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.14675483 = queryNorm
          4.2588034 = fieldWeight in 547, product of:
            1.0 = tf(freq=1.0), with freq of:
              1.0 = termFreq=1.0
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.625 = fieldNorm(doc=547)
    
  4. Schmidt, P.: Über die Gestaltung des Schlagwortkatalogs der Universitätsbibliothek in Basel (1942) 4.26
    4.258803 = sum of:
      4.258803 = weight(author_txt:schmidt in 622) [ClassicSimilarity], result of:
        4.258803 = score(doc=622,freq=1.0), product of:
          0.99999994 = queryWeight, product of:
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.14675483 = queryNorm
          4.2588034 = fieldWeight in 622, product of:
            1.0 = tf(freq=1.0), with freq of:
              1.0 = termFreq=1.0
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.625 = fieldNorm(doc=622)
    
  5. Schmidt, P.: Über den Basler Schlagwortkatalog (1952) 4.26
    4.258803 = sum of:
      4.258803 = weight(author_txt:schmidt in 623) [ClassicSimilarity], result of:
        4.258803 = score(doc=623,freq=1.0), product of:
          0.99999994 = queryWeight, product of:
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.14675483 = queryNorm
          4.2588034 = fieldWeight in 623, product of:
            1.0 = tf(freq=1.0), with freq of:
              1.0 = termFreq=1.0
            6.8140855 = idf(docFreq=131, maxDocs=44218)
            0.625 = fieldNorm(doc=623)
    

Similar documents (content)

  1. Beck, H.: ¬Das neue Lernen heißt verstehen (2020) 0.10
    0.09917808 = sum of:
      0.09917808 = product of:
        0.39671233 = sum of:
          0.045970876 = weight(abstract_txt:wenn in 4554) [ClassicSimilarity], result of:
            0.045970876 = score(doc=4554,freq=1.0), product of:
              0.11444592 = queryWeight, product of:
                5.1415305 = idf(docFreq=702, maxDocs=44218)
                0.022259114 = queryNorm
              0.40168208 = fieldWeight in 4554, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.1415305 = idf(docFreq=702, maxDocs=44218)
                0.078125 = fieldNorm(doc=4554)
          0.10736963 = weight(abstract_txt:erklärt in 4554) [ClassicSimilarity], result of:
            0.10736963 = score(doc=4554,freq=1.0), product of:
              0.20146492 = queryWeight, product of:
                1.326782 = boost
                6.82169 = idf(docFreq=130, maxDocs=44218)
                0.022259114 = queryNorm
              0.53294456 = fieldWeight in 4554, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.82169 = idf(docFreq=130, maxDocs=44218)
                0.078125 = fieldNorm(doc=4554)
          0.24337183 = weight(abstract_txt:kopf in 4554) [ClassicSimilarity], result of:
            0.24337183 = score(doc=4554,freq=2.0), product of:
              0.27591926 = queryWeight, product of:
                1.5527117 = boost
                7.983315 = idf(docFreq=40, maxDocs=44218)
                0.022259114 = queryNorm
              0.88204 = fieldWeight in 4554, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                7.983315 = idf(docFreq=40, maxDocs=44218)
                0.078125 = fieldNorm(doc=4554)
        0.25 = coord(3/12)
    
  2. Dehaene, S.: ¬Der Zahlensinn oder warum wir rechnen können (1999) 0.09
    0.09315317 = sum of:
      0.09315317 = product of:
        0.558919 = sum of:
          0.21473926 = weight(abstract_txt:erklärt in 4953) [ClassicSimilarity], result of:
            0.21473926 = score(doc=4953,freq=1.0), product of:
              0.20146492 = queryWeight, product of:
                1.326782 = boost
                6.82169 = idf(docFreq=130, maxDocs=44218)
                0.022259114 = queryNorm
              1.0658891 = fieldWeight in 4953, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.82169 = idf(docFreq=130, maxDocs=44218)
                0.15625 = fieldNorm(doc=4953)
          0.34417975 = weight(abstract_txt:kopf in 4953) [ClassicSimilarity], result of:
            0.34417975 = score(doc=4953,freq=1.0), product of:
              0.27591926 = queryWeight, product of:
                1.5527117 = boost
                7.983315 = idf(docFreq=40, maxDocs=44218)
                0.022259114 = queryNorm
              1.247393 = fieldWeight in 4953, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.983315 = idf(docFreq=40, maxDocs=44218)
                0.15625 = fieldNorm(doc=4953)
        0.16666667 = coord(2/12)
    
  3. Moglen, E.: ¬Die Musik sei mit uns : Wie die Industrie an Napster zugrunde geht (2001) 0.07
    0.07082184 = sum of:
      0.07082184 = product of:
        0.28328735 = sum of:
          0.0367767 = weight(abstract_txt:wenn in 5642) [ClassicSimilarity], result of:
            0.0367767 = score(doc=5642,freq=4.0), product of:
              0.11444592 = queryWeight, product of:
                5.1415305 = idf(docFreq=702, maxDocs=44218)
                0.022259114 = queryNorm
              0.32134566 = fieldWeight in 5642, product of:
                2.0 = tf(freq=4.0), with freq of:
                  4.0 = termFreq=4.0
                5.1415305 = idf(docFreq=702, maxDocs=44218)
                0.03125 = fieldNorm(doc=5642)
          0.06912237 = weight(abstract_txt:gewinnen in 5642) [ClassicSimilarity], result of:
            0.06912237 = score(doc=5642,freq=2.0), product of:
              0.21960433 = queryWeight, product of:
                1.3852249 = boost
                7.122176 = idf(docFreq=96, maxDocs=44218)
                0.022259114 = queryNorm
              0.3147587 = fieldWeight in 5642, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                7.122176 = idf(docFreq=96, maxDocs=44218)
                0.03125 = fieldNorm(doc=5642)
          0.1773883 = weight(abstract_txt:sieg in 5642) [ClassicSimilarity], result of:
            0.1773883 = score(doc=5642,freq=2.0), product of:
              0.4116345 = queryWeight, product of:
                1.8965126 = boost
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.022259114 = queryNorm
              0.4309364 = fieldWeight in 5642, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.03125 = fieldNorm(doc=5642)
        0.25 = coord(3/12)
    
  4. Wiesenbauer, L.: Erfolgsfaktor Wissen : Das Know-how der Mitarbeiter wirksam nutzen (2001) 0.07
    0.06805059 = sum of:
      0.06805059 = product of:
        0.27220237 = sum of:
          0.0367767 = weight(abstract_txt:wenn in 3425) [ClassicSimilarity], result of:
            0.0367767 = score(doc=3425,freq=1.0), product of:
              0.11444592 = queryWeight, product of:
                5.1415305 = idf(docFreq=702, maxDocs=44218)
                0.022259114 = queryNorm
              0.32134566 = fieldWeight in 3425, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.1415305 = idf(docFreq=702, maxDocs=44218)
                0.0625 = fieldNorm(doc=3425)
          0.09775379 = weight(abstract_txt:gewinnen in 3425) [ClassicSimilarity], result of:
            0.09775379 = score(doc=3425,freq=1.0), product of:
              0.21960433 = queryWeight, product of:
                1.3852249 = boost
                7.122176 = idf(docFreq=96, maxDocs=44218)
                0.022259114 = queryNorm
              0.445136 = fieldWeight in 3425, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.122176 = idf(docFreq=96, maxDocs=44218)
                0.0625 = fieldNorm(doc=3425)
          0.1376719 = weight(abstract_txt:kopf in 3425) [ClassicSimilarity], result of:
            0.1376719 = score(doc=3425,freq=1.0), product of:
              0.27591926 = queryWeight, product of:
                1.5527117 = boost
                7.983315 = idf(docFreq=40, maxDocs=44218)
                0.022259114 = queryNorm
              0.4989572 = fieldWeight in 3425, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.983315 = idf(docFreq=40, maxDocs=44218)
                0.0625 = fieldNorm(doc=3425)
        0.25 = coord(3/12)
    
  5. ¬Die "Sieben Kammern des Wissens" (2003) 0.07
    0.06573788 = sum of:
      0.06573788 = product of:
        0.78885454 = sum of:
          0.78885454 = weight(abstract_txt:quiz in 1949) [ClassicSimilarity], result of:
            0.78885454 = score(doc=1949,freq=1.0), product of:
              0.42475218 = queryWeight, product of:
                1.926494 = boost
                9.905128 = idf(docFreq=5, maxDocs=44218)
                0.022259114 = queryNorm
              1.8572114 = fieldWeight in 1949, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.905128 = idf(docFreq=5, maxDocs=44218)
                0.1875 = fieldNorm(doc=1949)
        0.083333336 = coord(1/12)