Document (#28386)

Author
Rötzer, F.
Title
Computer ergooglen die Bedeutung von Worten
Source
http://www.telepolis.de/r4/artikel/19/19326/1.html
Year
2005
Abstract
Holländische Wissenschaftler glauben, mit der "normalisierten Google-Distanz" von Begriffen einer Künstlichen Intelligenz die Bedeutung von Worten automatisch lehren zu können
Content
"Wie könnten Computer Sprache lernen und dabei auch die Bedeutung von Worten sowie die Beziehungen zwischen ihnen verstehen? Dieses Problem der Semantik stellt eine gewaltige, bislang nur ansatzweise bewältigte Aufgabe dar, da Worte und Wortverbindungen oft mehrere oder auch viele Bedeutungen haben, die zudem vom außersprachlichen Kontext abhängen. Die beiden holländischen (Ein künstliches Bewusstsein aus einfachen Aussagen (1)). Paul Vitanyi (2) und Rudi Cilibrasi vom Nationalen Institut für Mathematik und Informatik (3) in Amsterdam schlagen eine elegante Lösung vor: zum Nachschlagen im Internet, der größten Datenbank, die es gibt, wird einfach Google benutzt. Objekte wie eine Maus können mit ihren Namen "Maus" benannt werden, die Bedeutung allgemeiner Begriffe muss aus ihrem Kontext gelernt werden. Ein semantisches Web zur Repräsentation von Wissen besteht aus den möglichen Verbindungen, die Objekte und ihre Namen eingehen können. Natürlich können in der Wirklichkeit neue Namen, aber auch neue Bedeutungen und damit neue Verknüpfungen geschaffen werden. Sprache ist lebendig und flexibel. Um einer Künstlichen Intelligenz alle Wortbedeutungen beizubringen, müsste mit der Hilfe von menschlichen Experten oder auch vielen Mitarbeitern eine riesige Datenbank mit den möglichen semantischen Netzen aufgebaut und dazu noch ständig aktualisiert werden. Das aber müsste gar nicht notwendig sein, denn mit dem Web gibt es nicht nur die größte und weitgehend kostenlos benutzbare semantische Datenbank, sie wird auch ständig von zahllosen Internetnutzern aktualisiert. Zudem gibt es Suchmaschinen wie Google, die Verbindungen zwischen Worten und damit deren Bedeutungskontext in der Praxis in ihrer Wahrscheinlichkeit quantitativ mit der Angabe der Webseiten, auf denen sie gefunden wurden, messen.
Mit einem bereits zuvor von Paul Vitanyi und anderen entwickeltem Verfahren, das den Zusammenhang von Objekten misst (normalized information distance - NID ), kann die Nähe zwischen bestimmten Objekten (Bilder, Worte, Muster, Intervalle, Genome, Programme etc.) anhand aller Eigenschaften analysiert und aufgrund der dominanten gemeinsamen Eigenschaft bestimmt werden. Ähnlich können auch die allgemein verwendeten, nicht unbedingt "wahren" Bedeutungen von Namen mit der Google-Suche erschlossen werden. 'At this moment one database stands out as the pinnacle of computer-accessible human knowledge and the most inclusive summary of statistical information: the Google search engine. There can be no doubt that Google has already enabled science to accelerate tremendously and revolutionized the research process. It has dominated the attention of internet users for years, and has recently attracted substantial attention of many Wall Street investors, even reshaping their ideas of company financing.' (Paul Vitanyi und Rudi Cilibrasi) Gibt man ein Wort ein wie beispielsweise "Pferd", erhält man bei Google 4.310.000 indexierte Seiten. Für "Reiter" sind es 3.400.000 Seiten. Kombiniert man beide Begriffe, werden noch 315.000 Seiten erfasst. Für das gemeinsame Auftreten beispielsweise von "Pferd" und "Bart" werden zwar noch immer erstaunliche 67.100 Seiten aufgeführt, aber man sieht schon, dass "Pferd" und "Reiter" enger zusammen hängen. Daraus ergibt sich eine bestimmte Wahrscheinlichkeit für das gemeinsame Auftreten von Begriffen. Aus dieser Häufigkeit, die sich im Vergleich mit der maximalen Menge (5.000.000.000) an indexierten Seiten ergibt, haben die beiden Wissenschaftler eine statistische Größe entwickelt, die sie "normalised Google distance" (NGD) nennen und die normalerweise zwischen 0 und 1 liegt. Je geringer NGD ist, desto enger hängen zwei Begriffe zusammen. "Das ist eine automatische Bedeutungsgenerierung", sagt Vitanyi gegenüber dern New Scientist (4). "Das könnte gut eine Möglichkeit darstellen, einen Computer Dinge verstehen und halbintelligent handeln zu lassen." Werden solche Suchen immer wieder durchgeführt, lässt sich eine Karte für die Verbindungen von Worten erstellen. Und aus dieser Karte wiederum kann ein Computer, so die Hoffnung, auch die Bedeutung der einzelnen Worte in unterschiedlichen natürlichen Sprachen und Kontexten erfassen. So habe man über einige Suchen realisiert, dass ein Computer zwischen Farben und Zahlen unterscheiden, holländische Maler aus dem 17. Jahrhundert und Notfälle sowie Fast-Notfälle auseinander halten oder elektrische oder religiöse Begriffe verstehen könne. Überdies habe eine einfache automatische Übersetzung Englisch-Spanisch bewerkstelligt werden können. Auf diese Weise ließe sich auch, so hoffen die Wissenschaftler, die Bedeutung von Worten erlernen, könne man Spracherkennung verbessern oder ein semantisches Web erstellen und natürlich endlich eine bessere automatische Übersetzung von einer Sprache in die andere realisieren.
Links (1) http://www.telepolis.de/r4/artikel/8/8653/1.html (2) http://homepages.cwi.nl/ paulv/ (3) http://www.cwi.nl/ (4) http://www.newscientist.com/
Footnote
Artikel in der ListeTelepolis vom 27.01.2005
Theme
Computerlinguistik
Field
Sprachwissenschaft
Informatik
Object
Google

Similar documents (author)

  1. Rötzer, F.: Digitale Weltentwürfe : Streifzüge durch die Netzkultur (1998) 5.09
    5.0913243 = sum of:
      5.0913243 = weight(author_txt:rötzer in 5715) [ClassicSimilarity], result of:
        5.0913243 = fieldWeight in 5715, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          8.146119 = idf(docFreq=34, maxDocs=44421)
          0.625 = fieldNorm(doc=5715)
    
  2. Rötzer, F.: Grundlagen einer neurotechnologischen Ethik (1996) 5.09
    5.0913243 = sum of:
      5.0913243 = weight(author_txt:rötzer in 2997) [ClassicSimilarity], result of:
        5.0913243 = fieldWeight in 2997, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          8.146119 = idf(docFreq=34, maxDocs=44421)
          0.625 = fieldNorm(doc=2997)
    
  3. Rötzer, F.: Sicherheit geht vor Datenschutz (2006) 5.09
    5.0913243 = sum of:
      5.0913243 = weight(author_txt:rötzer in 5932) [ClassicSimilarity], result of:
        5.0913243 = fieldWeight in 5932, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          8.146119 = idf(docFreq=34, maxDocs=44421)
          0.625 = fieldNorm(doc=5932)
    
  4. Rötzer, F.: Unsterblichkeiten und Körperverbesserungen : Von digitalen Träumereien, materiellen Wirklichkeiten und der Hoffnung auf den Zufall (2000) 5.09
    5.0913243 = sum of:
      5.0913243 = weight(author_txt:rötzer in 6340) [ClassicSimilarity], result of:
        5.0913243 = fieldWeight in 6340, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          8.146119 = idf(docFreq=34, maxDocs=44421)
          0.625 = fieldNorm(doc=6340)
    
  5. Rötzer, F.: "Das Dasein des Menschen macht die Existenz der Dinge doch erst interessant" (1984) 5.09
    5.0913243 = sum of:
      5.0913243 = weight(author_txt:rötzer in 6954) [ClassicSimilarity], result of:
        5.0913243 = fieldWeight in 6954, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          8.146119 = idf(docFreq=34, maxDocs=44421)
          0.625 = fieldNorm(doc=6954)
    

Similar documents (content)

  1. Hesse, W.: Können Maschinen denken? : Eine kritische Auseinandersetzung mit der harten These der KI (1993) 0.27
    0.26678556 = sum of:
      0.26678556 = product of:
        0.74699956 = sum of:
          0.01928328 = weight(abstract_txt:einer in 376) [ClassicSimilarity], result of:
            0.01928328 = score(doc=376,freq=1.0), product of:
              0.063571766 = queryWeight, product of:
                3.882635 = idf(docFreq=2486, maxDocs=44421)
                0.016373355 = queryNorm
              0.30333087 = fieldWeight in 376, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                3.882635 = idf(docFreq=2486, maxDocs=44421)
                0.078125 = fieldNorm(doc=376)
          0.045925323 = weight(abstract_txt:computer in 376) [ClassicSimilarity], result of:
            0.045925323 = score(doc=376,freq=3.0), product of:
              0.07860885 = queryWeight, product of:
                1.1119969 = boost
                4.317478 = idf(docFreq=1609, maxDocs=44421)
                0.016373355 = queryNorm
              0.5842259 = fieldWeight in 376, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                4.317478 = idf(docFreq=1609, maxDocs=44421)
                0.078125 = fieldNorm(doc=376)
          0.08549646 = weight(abstract_txt:intelligenz in 376) [ClassicSimilarity], result of:
            0.08549646 = score(doc=376,freq=1.0), product of:
              0.17157044 = queryWeight, product of:
                1.6428167 = boost
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.016373355 = queryNorm
              0.498317 = fieldWeight in 376, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.078125 = fieldNorm(doc=376)
          0.17566 = weight(abstract_txt:künstlichen in 376) [ClassicSimilarity], result of:
            0.17566 = score(doc=376,freq=2.0), product of:
              0.22008087 = queryWeight, product of:
                1.8606257 = boost
                7.2241306 = idf(docFreq=87, maxDocs=44421)
                0.016373355 = queryNorm
              0.79816115 = fieldWeight in 376, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                7.2241306 = idf(docFreq=87, maxDocs=44421)
                0.078125 = fieldNorm(doc=376)
          0.4206345 = weight(abstract_txt:worten in 376) [ClassicSimilarity], result of:
            0.4206345 = score(doc=376,freq=1.0), product of:
              0.6253027 = queryWeight, product of:
                4.435351 = boost
                8.610425 = idf(docFreq=21, maxDocs=44421)
                0.016373355 = queryNorm
              0.67268944 = fieldWeight in 376, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.610425 = idf(docFreq=21, maxDocs=44421)
                0.078125 = fieldNorm(doc=376)
        0.35714287 = coord(5/14)
    
  2. Ornes, S.: Mathematiker aus Silizium (2021) 0.22
    0.21843745 = sum of:
      0.21843745 = product of:
        0.764531 = sum of:
          0.063636 = weight(abstract_txt:computer in 1086) [ClassicSimilarity], result of:
            0.063636 = score(doc=1086,freq=1.0), product of:
              0.07860885 = queryWeight, product of:
                1.1119969 = boost
                4.317478 = idf(docFreq=1609, maxDocs=44421)
                0.016373355 = queryNorm
              0.80952716 = fieldWeight in 1086, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                4.317478 = idf(docFreq=1609, maxDocs=44421)
                0.1875 = fieldNorm(doc=1086)
          0.1975986 = weight(abstract_txt:wissenschaftler in 1086) [ClassicSimilarity], result of:
            0.1975986 = score(doc=1086,freq=1.0), product of:
              0.16731136 = queryWeight, product of:
                1.6222978 = boost
                6.2987905 = idf(docFreq=221, maxDocs=44421)
                0.016373355 = queryNorm
              1.1810232 = fieldWeight in 1086, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2987905 = idf(docFreq=221, maxDocs=44421)
                0.1875 = fieldNorm(doc=1086)
          0.20519151 = weight(abstract_txt:intelligenz in 1086) [ClassicSimilarity], result of:
            0.20519151 = score(doc=1086,freq=1.0), product of:
              0.17157044 = queryWeight, product of:
                1.6428167 = boost
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.016373355 = queryNorm
              1.1959608 = fieldWeight in 1086, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.1875 = fieldNorm(doc=1086)
          0.2981049 = weight(abstract_txt:künstlichen in 1086) [ClassicSimilarity], result of:
            0.2981049 = score(doc=1086,freq=1.0), product of:
              0.22008087 = queryWeight, product of:
                1.8606257 = boost
                7.2241306 = idf(docFreq=87, maxDocs=44421)
                0.016373355 = queryNorm
              1.3545245 = fieldWeight in 1086, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.2241306 = idf(docFreq=87, maxDocs=44421)
                0.1875 = fieldNorm(doc=1086)
        0.2857143 = coord(4/14)
    
  3. Zudnik, J.: Artifizielle Semantik : Wider das Chinesische Zimmer (2017) 0.20
    0.20162493 = sum of:
      0.20162493 = product of:
        0.47045815 = sum of:
          0.02699659 = weight(abstract_txt:einer in 426) [ClassicSimilarity], result of:
            0.02699659 = score(doc=426,freq=4.0), product of:
              0.063571766 = queryWeight, product of:
                3.882635 = idf(docFreq=2486, maxDocs=44421)
                0.016373355 = queryNorm
              0.42466322 = fieldWeight in 426, product of:
                2.0 = tf(freq=4.0), with freq of:
                  4.0 = termFreq=4.0
                3.882635 = idf(docFreq=2486, maxDocs=44421)
                0.0546875 = fieldNorm(doc=426)
          0.018560499 = weight(abstract_txt:computer in 426) [ClassicSimilarity], result of:
            0.018560499 = score(doc=426,freq=1.0), product of:
              0.07860885 = queryWeight, product of:
                1.1119969 = boost
                4.317478 = idf(docFreq=1609, maxDocs=44421)
                0.016373355 = queryNorm
              0.23611209 = fieldWeight in 426, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                4.317478 = idf(docFreq=1609, maxDocs=44421)
                0.0546875 = fieldNorm(doc=426)
          0.020304862 = weight(abstract_txt:können in 426) [ClassicSimilarity], result of:
            0.020304862 = score(doc=426,freq=1.0), product of:
              0.083459996 = queryWeight, product of:
                1.1457953 = boost
                4.448705 = idf(docFreq=1411, maxDocs=44421)
                0.016373355 = queryNorm
              0.24328856 = fieldWeight in 426, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                4.448705 = idf(docFreq=1411, maxDocs=44421)
                0.0546875 = fieldNorm(doc=426)
          0.050304502 = weight(abstract_txt:google in 426) [ClassicSimilarity], result of:
            0.050304502 = score(doc=426,freq=2.0), product of:
              0.12128475 = queryWeight, product of:
                1.3812459 = boost
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.016373355 = queryNorm
              0.4147636 = fieldWeight in 426, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.0546875 = fieldNorm(doc=426)
          0.059847526 = weight(abstract_txt:intelligenz in 426) [ClassicSimilarity], result of:
            0.059847526 = score(doc=426,freq=1.0), product of:
              0.17157044 = queryWeight, product of:
                1.6428167 = boost
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.016373355 = queryNorm
              0.3488219 = fieldWeight in 426, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.0546875 = fieldNorm(doc=426)
          0.29444417 = weight(abstract_txt:worten in 426) [ClassicSimilarity], result of:
            0.29444417 = score(doc=426,freq=1.0), product of:
              0.6253027 = queryWeight, product of:
                4.435351 = boost
                8.610425 = idf(docFreq=21, maxDocs=44421)
                0.016373355 = queryNorm
              0.47088262 = fieldWeight in 426, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.610425 = idf(docFreq=21, maxDocs=44421)
                0.0546875 = fieldNorm(doc=426)
        0.42857143 = coord(6/14)
    
  4. Wolfangel, E.: ¬Die Grenzen der künstlichen Intelligenz (2016) 0.16
    0.15988877 = sum of:
      0.15988877 = product of:
        0.55961066 = sum of:
          0.03856656 = weight(abstract_txt:einer in 107) [ClassicSimilarity], result of:
            0.03856656 = score(doc=107,freq=1.0), product of:
              0.063571766 = queryWeight, product of:
                3.882635 = idf(docFreq=2486, maxDocs=44421)
                0.016373355 = queryNorm
              0.60666174 = fieldWeight in 107, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                3.882635 = idf(docFreq=2486, maxDocs=44421)
                0.15625 = fieldNorm(doc=107)
          0.101630434 = weight(abstract_txt:google in 107) [ClassicSimilarity], result of:
            0.101630434 = score(doc=107,freq=1.0), product of:
              0.12128475 = queryWeight, product of:
                1.3812459 = boost
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.016373355 = queryNorm
              0.837949 = fieldWeight in 107, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.3628736 = idf(docFreq=565, maxDocs=44421)
                0.15625 = fieldNorm(doc=107)
          0.17099293 = weight(abstract_txt:intelligenz in 107) [ClassicSimilarity], result of:
            0.17099293 = score(doc=107,freq=1.0), product of:
              0.17157044 = queryWeight, product of:
                1.6428167 = boost
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.016373355 = queryNorm
              0.996634 = fieldWeight in 107, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.15625 = fieldNorm(doc=107)
          0.24842076 = weight(abstract_txt:künstlichen in 107) [ClassicSimilarity], result of:
            0.24842076 = score(doc=107,freq=1.0), product of:
              0.22008087 = queryWeight, product of:
                1.8606257 = boost
                7.2241306 = idf(docFreq=87, maxDocs=44421)
                0.016373355 = queryNorm
              1.1287704 = fieldWeight in 107, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.2241306 = idf(docFreq=87, maxDocs=44421)
                0.15625 = fieldNorm(doc=107)
        0.2857143 = coord(4/14)
    
  5. Ritchie, D.: Gehirn und Computer : Die Evolution einer neuen Intelligenz (1984) 0.16
    0.15621156 = sum of:
      0.15621156 = product of:
        0.43739235 = sum of:
          0.026719695 = weight(abstract_txt:einer in 6456) [ClassicSimilarity], result of:
            0.026719695 = score(doc=6456,freq=3.0), product of:
              0.063571766 = queryWeight, product of:
                3.882635 = idf(docFreq=2486, maxDocs=44421)
                0.016373355 = queryNorm
              0.42030758 = fieldWeight in 6456, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                3.882635 = idf(docFreq=2486, maxDocs=44421)
                0.0625 = fieldNorm(doc=6456)
          0.03674026 = weight(abstract_txt:computer in 6456) [ClassicSimilarity], result of:
            0.03674026 = score(doc=6456,freq=3.0), product of:
              0.07860885 = queryWeight, product of:
                1.1119969 = boost
                4.317478 = idf(docFreq=1609, maxDocs=44421)
                0.016373355 = queryNorm
              0.4673807 = fieldWeight in 6456, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                4.317478 = idf(docFreq=1609, maxDocs=44421)
                0.0625 = fieldNorm(doc=6456)
          0.065866195 = weight(abstract_txt:wissenschaftler in 6456) [ClassicSimilarity], result of:
            0.065866195 = score(doc=6456,freq=1.0), product of:
              0.16731136 = queryWeight, product of:
                1.6222978 = boost
                6.2987905 = idf(docFreq=221, maxDocs=44421)
                0.016373355 = queryNorm
              0.3936744 = fieldWeight in 6456, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2987905 = idf(docFreq=221, maxDocs=44421)
                0.0625 = fieldNorm(doc=6456)
          0.16753818 = weight(abstract_txt:intelligenz in 6456) [ClassicSimilarity], result of:
            0.16753818 = score(doc=6456,freq=6.0), product of:
              0.17157044 = queryWeight, product of:
                1.6428167 = boost
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.016373355 = queryNorm
              0.97649795 = fieldWeight in 6456, product of:
                2.4494898 = tf(freq=6.0), with freq of:
                  6.0 = termFreq=6.0
                6.3784575 = idf(docFreq=204, maxDocs=44421)
                0.0625 = fieldNorm(doc=6456)
          0.14052801 = weight(abstract_txt:künstlichen in 6456) [ClassicSimilarity], result of:
            0.14052801 = score(doc=6456,freq=2.0), product of:
              0.22008087 = queryWeight, product of:
                1.8606257 = boost
                7.2241306 = idf(docFreq=87, maxDocs=44421)
                0.016373355 = queryNorm
              0.63852894 = fieldWeight in 6456, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                7.2241306 = idf(docFreq=87, maxDocs=44421)
                0.0625 = fieldNorm(doc=6456)
        0.35714287 = coord(5/14)