-
Fromme, A.: Strukturierung facettierter Thesauri : Probleme und Methoden, dargestellt an ausgewählten Beispielen (1991)
0.02
0.016385881 = product of:
0.065543525 = sum of:
0.065543525 = weight(_text_:und in 1107) [ClassicSimilarity], result of:
0.065543525 = score(doc=1107,freq=4.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.55409175 = fieldWeight in 1107, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.125 = fieldNorm(doc=1107)
0.25 = coord(1/4)
- Theme
- Konzeption und Anwendung des Prinzips Thesaurus
-
Dehnhard, H.: Aufbau und Benutzung eines DK-Thesaurus : Probleme und Möglichkeiten der Sachkatalogisierung mit Hilfe der elektronischen Datenverarbeitung (1971)
0.02
0.016385881 = product of:
0.065543525 = sum of:
0.065543525 = weight(_text_:und in 1481) [ClassicSimilarity], result of:
0.065543525 = score(doc=1481,freq=4.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.55409175 = fieldWeight in 1481, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.125 = fieldNorm(doc=1481)
0.25 = coord(1/4)
-
Karg, H.; Bee, G.: Navigieren zwischen Schlagwort und Notation : CrissCross als Verbindung zwischen SWD und DDC (2007)
0.01
0.01228941 = product of:
0.04915764 = sum of:
0.04915764 = weight(_text_:und in 413) [ClassicSimilarity], result of:
0.04915764 = score(doc=413,freq=16.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.41556883 = fieldWeight in 413, product of:
4.0 = tf(freq=16.0), with freq of:
16.0 = termFreq=16.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=413)
0.25 = coord(1/4)
- Abstract
- CrissCross ist der Name eines von der Deutschen Nationalbibliothek und der Fachhochschule Köln gemeinsam betriebenen und von der DFG geförderten Projekts, dessen Ziel es ist, durch die Verbindung von klassifikatorischen und verbalen Erschließungsinstrumenten ein benutzergerechtes Recherchevokabular zu schaffen, um die Suche in heterogen erschlossenen Bibliotheksbeständen zu erleichtern. Im Rahmen des Projektes werden die Sachschlagwörter der Schlagwortnormdatei (SWD) mit den Notationen der Dewey-Dezimalklassifikation (DDC) verbunden. Auf diese Weise entsteht ein dichtes Beziehungsnetz zwischen der weltweit verbreitetsten Klassifikation und der im deutschen Sprachgebiet dominierenden Dokumentationssprache. Der Vortrag gibt einen Überblick über die Vorgehensweise bei der Verknüpfung von DDC-Klassen und SWD-Sachschlagwörtern und zeigt Pespektiven auf, die sich aus der Vernetzung ergeben.
-
Gödert, W.: Multilingualität und Lokalisierung zur Wissenserkundung : oder vom Nutzen semantischer Netze für das Information Retrieval (2007)
0.01
0.011495691 = product of:
0.045982763 = sum of:
0.045982763 = weight(_text_:und in 557) [ClassicSimilarity], result of:
0.045982763 = score(doc=557,freq=14.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.38872904 = fieldWeight in 557, product of:
3.7416575 = tf(freq=14.0), with freq of:
14.0 = termFreq=14.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=557)
0.25 = coord(1/4)
- Abstract
- Das CrissCross-Projekt verfolgt die Zielsetzung, ein erweitertes multilinguales und thesaurusbasiertes Registervokabular zur Dewey-Dezimalklassifikation (DDC Deutsch) zu erstellen, das als Recherchevokabulars zu heterogen erschlossenen Dokumenten verwendet werden kann und soll damit die Ausgangsbedingungen für die Gestaltung von OPAC-Retrievalumgebungen verbessern helfen. Im einzelnen soll jedes Sachschlagwort der Schlagwortnormdatei (SWD) eine DDC-Notation erhalten und es sollen die im Projekt MACS begonnen Arbeiten fortgesetzt werden, Links zwischen den Schlagwörtern der SWD, den Library of Congress Subject Headings (LCSH) und dem Répertoire d'autorité-matière encyclopédique et alphabétique unifé (Rameau) herzustellen. In diesem Beitrag wird der Vorschlag gemacht, die Zielsetzung des Projektes darin zu sehen, eine Kern-Ontologie mit universalen Relationen als Klassifikation zu benutzen und die beteiligten Normdateien als zugeordnete semantische Netze zu entwickeln, indem nicht-generische Relationen die Aufgabe der durch die Lokalisierung gestellten Anforderungen übernehmen. Generische Relationen im bekannten Thesaurussinn sind für derartige semantische Netze nicht mehr erforderlich, da sie sich aus den generischen Beziehungen der Kern-Ontologie vererben.
- Series
- Schriften der Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare (VÖB); Bd. 2
-
Sandner, M.: Neues aus der Kommission für Sacherschliessung (2005)
0.01
0.011047897 = product of:
0.044191588 = sum of:
0.044191588 = weight(_text_:und in 2183) [ClassicSimilarity], result of:
0.044191588 = score(doc=2183,freq=38.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.3735868 = fieldWeight in 2183, product of:
6.164414 = tf(freq=38.0), with freq of:
38.0 = termFreq=38.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.02734375 = fieldNorm(doc=2183)
0.25 = coord(1/4)
- Content
- "Unsere Sitzung fand diesmal am 13. 9. 2005 in Bozen im Rahmen der ODOK statt. Es waren daher auch viele interessierte Südtiroler und italienische Sacherschließungskollegen/-innen zu Gast. Eine der beiden Konferenzsprachen war Englisch, und so konnten wir Mehrsprachigkeit, das Thema unserer Sitzung und der beiden Gastvorträge, gleich selbst praktizieren. Patrice LANDRY, der Leiter der Sacherschließung an derSLB in Bern, der seit kurzem den Vorsitz der IFLA-Sektion "Classification and Indexing" und der Arbeitsgruppe "Guidelines for subject access for national bibliographic agencies" übernommen hatte, referierte über den jüngsten Stand des Projekts MACS (Multilingual Access to Subjects) und ließ uns am Nachmittag in seinem Workshop hinter die Kulissen der bereits mit echten Titeldaten operierenden Suchoberfläche blicken. Er zeigte die verschiedenen Recherche- und Editier-Funktionen im Management Linking System und brachte Beispiele für die kooperative Bearbeitung an einigen Datensätzen der bisher bereits miteinander verzahnten Normdateien SWD, LCSH und RAMEAU. Schließlich eröffnete er Ausblicke auf die künftige Einbindung weiterer Sprachen, etwa des Italienischen durch den Soggetario und auf die Anreicherung der Daten, etwa mit DDC-Notationen durch die Nähe zum DDB-Projekt "CrissCross". Federica PARADISI, die in der Sacherschließungsabteilung der BNC in Florenz sowohl für die italienische Übersetzung der DDC und deren Anwendung in ganz Italien als auch für die Überarbeitung des seit 1956 existierenden italienischen Wortschatzes für die verbale Erschließung und für dessen Aufbereitung zu einer modernen, bald auch elektronischen Normdatei zuständig ist und an der Erstellung der italienischen Nationalbibliografie mitwirkt, hat zuletzt gemeinsam mit Anna Lucarelli den Prototyp des "Nuovo Soggetario" erarbeitet und stellte dieses umfangreiche Projekt vor. Der von ihr skizzierte Zeitplan gibt Anlass zur Hoffnung, dass MACS für die Auffindung beschlagworteter Literatur in Bibliothekskatalogen schon in einem Jahr um einen sprachlichen Zugang reicher sein könnte. Beide Gastreferenten/-innen standen dem Auditorium im Anschluss an die Präsentationen für Fragen zur Verfügung, und die neuen fachlichen Kontakte vertieften sich in den Pausengesprächen noch mehr. Vor der Führung durch die Dewey-Ausstellung im Lichthof der UB Bozen demonstrierte Margit SANDNER zum Abschluss dieses multilingualen Sacherschließungsnachmittags mit einigen Beispielen in deutscherSprache die Suchfunktionen in den beiden Webversionen von DDC Deutsch MelvilSearch (für OPACs) und MelvilClass (für das Klassifizieren) und kündigte an, dass ab Oktober bis Jahresende kostenlose Testaccounts vergeben werden. Wer daran interessiert ist, diese deutschsprachigen Webtools bereits auszuprobieren, wendet sich am besten direkt an Herrn Dr. Lars Svensson in Der Deutschen Bibliothek in Frankfurt: [email protected]. Die ab Jänner 2006 gültigen Lizenzbedingungen für "Melvil" entnehmen Sie bitte: http//www.ddc-deutsch.de/licence-melvil.html Noch zwei aktuelle Hinweise: - Informationstag der Arbeitsstelle für Standardisierung (DDB) über aktuelle Tendenzen in Sachen Regelwerke f. Formal- und Sacherschließung, Formate, Normdateien und Datentausch am 15. November in Wien. - Aufsatz über die Zukunft der SWD von Esther Scheven (BD 2005, H. 6, S. 748-773), in dem u. a. auch auf unsere seinerzeitige KofSE-Studie: Schlagwort "Benutzerforschung" ... (VÖB-Mitt. 1997, H. 3-4, S. 28-49) rekurriert wird."
- Source
- Mitteilungen der Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare. 58(2005) H.3, S.83-84
-
Dehnhard, H.: Probleme der Bearbeitung eines Allgemeinthesaurus auf der Grundlage der Dezimalklassifikation mit Hilfe der elektronischen Datenverarbeitung (1974)
0.01
0.010138246 = product of:
0.040552985 = sum of:
0.040552985 = weight(_text_:und in 1633) [ClassicSimilarity], result of:
0.040552985 = score(doc=1633,freq=2.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.34282678 = fieldWeight in 1633, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.109375 = fieldNorm(doc=1633)
0.25 = coord(1/4)
- Source
- Mitteilungen der Gesellschaft für Bibliothekswesen und Dokumentation des Landbaues. 1974, H.21, S.55-68
-
Dehnhard, H.: Probleme einer simultanen Bearbeitung alphabetischer und systematischer Sachkataloge mit Hilfe der elektronischen Datenverarbeitung (1968)
0.01
0.010138246 = product of:
0.040552985 = sum of:
0.040552985 = weight(_text_:und in 1634) [ClassicSimilarity], result of:
0.040552985 = score(doc=1634,freq=2.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.34282678 = fieldWeight in 1634, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.109375 = fieldNorm(doc=1634)
0.25 = coord(1/4)
-
Schott, H.; Schroeder, A.: Crosskonkordanzen von Thesauri und Klassifikationen (2004)
0.01
0.009715633 = product of:
0.03886253 = sum of:
0.03886253 = weight(_text_:und in 3126) [ClassicSimilarity], result of:
0.03886253 = score(doc=3126,freq=10.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.328536 = fieldWeight in 3126, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=3126)
0.25 = coord(1/4)
- Abstract
- Im folgenden wird über ein Projekt berichtet, das als Arbeitspaket eingebunden war in die Sonderfördermaßnahme CARMEN (Content Analysis, Retrieval and MetaData: Effective Networking), die im Rahmen von Global Info vom BMBF gefördert wurde. Die Bearbeitung von Crosskonkordanzen war dem Themenschwerpunkt "Verfahren zur Behandlung von Heterogenität bei textueller Information verschiedener Datentypen und Inhaltserschließungsverfahren" zugeordnet. Darin ging es neben maschinellen Verfahren zur Erzeugung von Metadaten um die Behandlung semantischer Heterogenität durch Transferbeziehungen, die maschinell mit Hilfe quantitativ-statistischer Verfahren und intellektuell durch Crosskonkordanzen hergestellt wurden. Konkreter Zweck der Crosskonkordanzen ist es, eine integrierte Suche nach sachlichen Gesichtspunkten in verteilten Datenbeständen mit unterschiedlichen inhaltlichen Schwerpunkten zu ermöglichen. Die Crosskonkordanzen sollen dabei den begrifflichen Unterschieden der verwendeten Klassifikationen und Thesauri Rechnung tragen.
- Source
- Wissensorganisation in kooperativen Lern- und Arbeitsumgebungen: Proceedings der 8. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation, Regensburg, 9.-11. Oktober 2002. Hrsg.: G. Budin u. H.P. Ohly
-
Gödert, W.: Komplementarität bei der Klassenbildung in der klassifikatorischen und verbalen Sacherschließung (1985)
0.01
0.008689925 = product of:
0.0347597 = sum of:
0.0347597 = weight(_text_:und in 3304) [ClassicSimilarity], result of:
0.0347597 = score(doc=3304,freq=2.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.29385152 = fieldWeight in 3304, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.09375 = fieldNorm(doc=3304)
0.25 = coord(1/4)
-
Bee, G.: CrissCross (2006)
0.01
0.00840619 = product of:
0.03362476 = sum of:
0.03362476 = weight(_text_:und in 1275) [ClassicSimilarity], result of:
0.03362476 = score(doc=1275,freq=22.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.28425696 = fieldWeight in 1275, product of:
4.690416 = tf(freq=22.0), with freq of:
22.0 = termFreq=22.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.02734375 = fieldNorm(doc=1275)
0.25 = coord(1/4)
- Content
- "»Simplify your life«, heißt einer der großen Sachbuchbestseller der letzten Jahre. Dessen Quintessenz: In einer zusehends komplexer werdenden Welt sind Vereinfachungen (über)lebensnotwendig. Dies gilt für alle Lebensbereiche, in besonderem Maße aber für die Suche nach Informationen. Um Bibliotheksbenutzer an die von ihnen gewünschte Literatur heranzuführen, kann seitens der Bibliotheken sicher noch einiges an Vereinfachungsleistung erbracht werden - insbesondere dann, wenn der Benutzer sich bei der Suche nicht mit den Beständen seines nationalen Bibliothekssystems begnügt, sondern die Möglichkeit nutzt, weltweit online zu recherchieren. Eine Suche unter Zuhilfenahme von Titelstichwörtern bereitet heute nur wenig Kopfzerbrechen, ist aber oft unbefriedigend für die sachliche Suche. Leider gestaltet sich der hier deutlich zielführende Rückgriff auf Sacherschließungsdaten in der Praxis erheblich schwieriger. Der Benutzer ist mit einer Vielzahl unterschiedlicher Erschließungssysteme konfrontiert, die vielfach unverbunden nebeneinander existieren. Da die Bestände der weitaus meisten Bibliotheken heterogen erschlossen sind, müsste der Benutzer alle Erschließungsverfahren kennen und nacheinander anwenden, um sicherzustellen, dass ihm keine Informationen verloren gehen.
An diesem Punkt setzt das neue Projekt CrissCross an, das gemeinsam von der Deutschen Nationalbibliothek (DNB) und der Fachhochschule Köln betrieben und von der Deutschen Forschungsgemeinschaft (DFG) gefördert wird. CrissCross schafft Verbindungslinien zwischen einigen besonders verbreiteten und bewährten Erschließungsinstrumenten: Der deutschsprachigen Schlagwortnormdatei (SWD), den besonders im angloamerikanischen Raum verbreiteten Library of Congress Subject Headings (LCSH), der französischen Dokumentationssprache Répertoire d'autorité-matière encyclopédique et alphabétique unifié (Rameau) und der Dewey Decimal Classification (DDC) als dem international am meisten verbreiteten Klassifikationssystem. CrissCross kann dabei auf zwei wichtigen Vorgängerprojekten aufbauen. Hier ist zum einen das ebenfalls von DNB und der Fachhochschule Köln gemeinsam betriebene Vorgängerprojekt »DDC Deutsch« zu nennen. Bereits während dessen Laufzeit war deutlich geworden, wie vorteilhaft sich eine Anreicherung des DDC-Registers mit dem Schlagwortbestand der SWD auf die Klassifikationspraxis auswirken könnte. Genau dieser Schritt wird nun vollzogen, wobei sich die Projektarbeit auf die Sachschlagwörter konzentriert - kein kleines Unterfangen, beläuft sich doch die Zahl der zurzeit in der SWD befindlichen Datensätze mit dem Indikator s auf über 154.000.
Ein weiteres Fundament sind die Vorarbeiten aus dem gemeinsam von DNB, der Schweizerischen Landesbibliothek und anderen Partnern betriebenen Projekt Multilingual Access to Subjects (MACS). Im Rahmen von MACS wurden in größerem Umfang LCSH und Rameau-Datensätze miteinander verknüpft; einigen der dabei entstandenen Schlagwortpärchen wurde dabei bereits ein SWD-Äquivalent zugeordnet. Dreierverbindungen dieses Typs, erweitert um DDC-Notationen, werden auch im Rahmen von CrissCross entstehen. Die unterschiedliche Strukturierung der einzelnen Schlagwortsprachen sorgt allerdings für eine Vielzahl von Problemen, die das Projektteam bewältigen muss. Durch die Verlinkung der Schlagwortsprachen und die Verknüpfung mit der DDC erstellt CrissCross ein multilinguales verbales Recherchevokabular. Ungewöhnlich und innovativ ist dabei vor allem die Verbindung von verbaler und klassifikatorischer Sacherschließung, die zu einer bedeutenden Erweiterung der Recherchemöglichkeiten führen wird. Dies wird vor allem dann der Fall sein, wenn in Onlineumgebungen nutzbare Hilfsmittel wie das von der DNB zurzeit entwickelte Normdatenrecherchetool zur Verfügung stehen. In naher Zukunft wird der Nutzer dann bei seiner Suche auf eine Vielzahl unterschiedlich erschlossener Werke stoßen, ohne dass ihm die im Hintergrund vollzogene Auswertung von Normdaten bewusst sein muss. Er braucht im Grunde genommen überhaupt kein Vorwissen über Sacherschließungsinstrumente mitzubringen. »Simplify your search«, könnte das Motto dieser Vorgehensweise lauten. Die Nutzerfreundlichkeit der Bibliotheken wird durch den Einsatz derartiger Instrumente eine deutliche Steigerung erfahren. CrissCross wird seinen Teil dazu beitragen."
-
Maibach, C.: ¬Die DDC auf neuen Wegen : verbale Sucheinstiege für klassifikatorisch erschlossene Titel (2014)
0.01
0.0075256964 = product of:
0.030102786 = sum of:
0.030102786 = weight(_text_:und in 2482) [ClassicSimilarity], result of:
0.030102786 = score(doc=2482,freq=6.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.2544829 = fieldWeight in 2482, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=2482)
0.25 = coord(1/4)
- Abstract
- Die Dewey-Dezimalklassifikation (DDC) ist ein mächtiges Instrument der klassifikatorischen Inhaltserschließung. Immer mehr Bibliotheken im In- und Ausland erkennen den Nutzen der international am weitesten verbreiteten Universalklassifikation. Die Deutsche Nationalbibliothek (DNB) setzt die DDC seit 2006 für die inhaltliche Erschließung der Bibliografiereihen A, B und H ein. Seitdem wurden rund 800.000 Publikationen mit DDC-Notationen versehen. Der Nutzen von Klassifikationen ist unter Bibliothekar/innen unumstritten. Die Bibliotheksnutzer/innen hingegen wissen oft nicht, dass der Katalog ihrer Bibliothek auch eine systematische Recherche ermöglicht. Ihre Recherchestrategie ist meist verbal. Durch Internetsuchmaschinen wird diese Strategie noch bestärkt. Daher liegt es nahe, auch für die klassifikatorisch erschlossenen Titel einen verbalen Sucheinstieg zu schaffen. ie DDC enthält nicht nur die in vielen Klassifikationssystemen üblichen Registereinträge und Klassenbenennungen, sondern auch die im Rahmen des Projekts CrissCross in großem Umfang erstellten Verknüpfungen zu Schlagwörtern der Gemeinsamen Normdatei (GND), die für diesen Zweck ausgewertet werden können.
-
Schulz, U.: Wie kann man verbale und klassifikatorische Inhaltserschließung miteinander verbinden : drei Modelle (1994)
0.01
0.007241605 = product of:
0.02896642 = sum of:
0.02896642 = weight(_text_:und in 8808) [ClassicSimilarity], result of:
0.02896642 = score(doc=8808,freq=2.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.24487628 = fieldWeight in 8808, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.078125 = fieldNorm(doc=8808)
0.25 = coord(1/4)
-
Gabler, S.: Vergabe von DDC-Sachgruppen mittels eines Schlagwort-Thesaurus (2021)
0.01
0.0062714135 = product of:
0.025085654 = sum of:
0.025085654 = weight(_text_:und in 1000) [ClassicSimilarity], result of:
0.025085654 = score(doc=1000,freq=6.0), product of:
0.118290015 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05337113 = queryNorm
0.21206908 = fieldWeight in 1000, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0390625 = fieldNorm(doc=1000)
0.25 = coord(1/4)
- Abstract
- Vorgestellt wird die Konstruktion eines thematisch geordneten Thesaurus auf Basis der Sachschlagwörter der Gemeinsamen Normdatei (GND) unter Nutzung der darin enthaltenen DDC-Notationen. Oberste Ordnungsebene dieses Thesaurus werden die DDC-Sachgruppen der Deutschen Nationalbibliothek. Die Konstruktion des Thesaurus erfolgt regelbasiert unter der Nutzung von Linked Data Prinzipien in einem SPARQL Prozessor. Der Thesaurus dient der automatisierten Gewinnung von Metadaten aus wissenschaftlichen Publikationen mittels eines computerlinguistischen Extraktors. Hierzu werden digitale Volltexte verarbeitet. Dieser ermittelt die gefundenen Schlagwörter über Vergleich der Zeichenfolgen Benennungen im Thesaurus, ordnet die Treffer nach Relevanz im Text und gibt die zugeordne-ten Sachgruppen rangordnend zurück. Die grundlegende Annahme dabei ist, dass die gesuchte Sachgruppe unter den oberen Rängen zurückgegeben wird. In einem dreistufigen Verfahren wird die Leistungsfähigkeit des Verfahrens validiert. Hierzu wird zunächst anhand von Metadaten und Erkenntnissen einer Kurzautopsie ein Goldstandard aus Dokumenten erstellt, die im Online-Katalog der DNB abrufbar sind. Die Dokumente vertei-len sich über 14 der Sachgruppen mit einer Losgröße von jeweils 50 Dokumenten. Sämtliche Dokumente werden mit dem Extraktor erschlossen und die Ergebnisse der Kategorisierung do-kumentiert. Schließlich wird die sich daraus ergebende Retrievalleistung sowohl für eine harte (binäre) Kategorisierung als auch eine rangordnende Rückgabe der Sachgruppen beurteilt.