-
Lande, D.; Braichevski, S.; Busch, D.: Informationsflüsse im Internet (2007)
0.01
0.013399985 = product of:
0.05359994 = sum of:
0.05359994 = weight(_text_:und in 628) [ClassicSimilarity], result of:
0.05359994 = score(doc=628,freq=10.0), product of:
0.12236088 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05520786 = queryNorm
0.438048 = fieldWeight in 628, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0625 = fieldNorm(doc=628)
0.25 = coord(1/4)
- Abstract
- Im Artikel geht es um Entwicklungstrends und Probleme, die mit dem schnellen Informationszuwachs im Internet verbunden sind. Es wird gezeigt, dass die Hauptschwierigkeiten nicht mit der Leistung von Software und der Hardware, sondern mit Besonderheiten des Sachgebietes zusammen hängen. Im Rahmen des Konzeptes der Informationsflüsse werden aktuelle Probleme des Information Retrieval, der Strukturierung des Informationsraums und dessen Verhältnis zum semantischen Raum behandelt. Der Artikel zeigt einige Lösungen dieser Probleme, die auf dem Textmining und fraktalen Modellen basieren.
- Source
- Information - Wissenschaft und Praxis. 58(2007) H.5, S.277-284
-
Busch, D.: ¬Ein XML-basierter Ansatz für Austausch Speicherung und Retrieval von bibliographischen Metadaten im Bereich Planen und Bauen (2011)
0.01
0.011724987 = product of:
0.04689995 = sum of:
0.04689995 = weight(_text_:und in 4305) [ClassicSimilarity], result of:
0.04689995 = score(doc=4305,freq=10.0), product of:
0.12236088 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05520786 = queryNorm
0.38329202 = fieldWeight in 4305, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0546875 = fieldNorm(doc=4305)
0.25 = coord(1/4)
- Abstract
- Es wird ein Ansatz zum Austausch, zur Speicherung und zum Retrieval von bibliographischen Sätzen in ICONDA®Bibliographic (International Construction Database) beschrieben. Nach einer Studie bestehender Ansätze wurde das Bibliographic Metadata Format (BMF) entwickelt, das auf XML basiert ist und Datenelemente nach ISO 2709 modelliert. Das neue Format wird nicht nur für den Austausch, sondern auch für die Speicherung der Sätze in der Datenbank verwendet. Der Artikel stellt einen Mechanismus für das Retrieval der XML-basierten Sätze mit dem Microsoft SQL Server dar.
- Source
- Information - Wissenschaft und Praxis. 62(2011) H.1, S.43-47
-
Busch, D.: Organisation eines Thesaurus für die Unterstützung der mehrsprachigen Suche in einer bibliographischen Datenbank im Bereich Planen und Bauen (2016)
0.01
0.011236228 = product of:
0.044944912 = sum of:
0.044944912 = weight(_text_:und in 3308) [ClassicSimilarity], result of:
0.044944912 = score(doc=3308,freq=18.0), product of:
0.12236088 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05520786 = queryNorm
0.3673144 = fieldWeight in 3308, product of:
4.2426405 = tf(freq=18.0), with freq of:
18.0 = termFreq=18.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0390625 = fieldNorm(doc=3308)
0.25 = coord(1/4)
- Abstract
- Das Problem der mehrsprachigen Suche gewinnt in der letzten Zeit immer mehr an Bedeutung, da viele nützliche Fachinformationen in der Welt in verschiedenen Sprachen publiziert werden. RSWBPlus ist eine bibliographische Datenbank zum Nachweis der Fachliteratur im Bereich Planen und Bauen, welche deutsch- und englischsprachige Metadaten-Einträge enthält. Bis vor Kurzem war es problematisch Einträge zu finden, deren Sprache sich von der Anfragesprache unterschied. Zum Beispiel fand man auf deutschsprachige Anfragen nur deutschsprachige Einträge, obwohl die Datenbank auch potenziell nützliche englischsprachige Einträge enthielt. Um das Problem zu lösen, wurde nach einer Untersuchung bestehender Ansätze, die RSWBPlus weiterentwickelt, um eine mehrsprachige (sprachübergreifende) Suche zu unterstützen, welche unter Einbeziehung eines zweisprachigen begriffbasierten Thesaurus erfolgt. Der Thesaurus wurde aus bereits bestehenden Thesauri automatisch gebildet. Die Einträge der Quell-Thesauri wurden in SKOS-Format (Simple Knowledge Organisation System) umgewandelt, automatisch miteinander vereinigt und schließlich in einen Ziel-Thesaurus eingespielt, der ebenfalls in SKOS geführt wird. Für den Zugriff zum Ziel-Thesaurus werden Apache Jena und MS SQL Server verwendet. Bei der mehrsprachigen Suche werden Terme der Anfrage durch entsprechende Übersetzungen und Synonyme in Deutsch und Englisch erweitert. Die Erweiterung der Suchterme kann sowohl in der Laufzeit, als auch halbautomatisch erfolgen. Das verbesserte Recherchesystem kann insbesondere deutschsprachigen Benutzern helfen, relevante englischsprachige Einträge zu finden. Die Verwendung vom SKOS erhöht die Interoperabilität der Thesauri, vereinfacht das Bilden des Ziel-Thesaurus und den Zugriff zu seinen Einträgen.
- Theme
- Konzeption und Anwendung des Prinzips Thesaurus
-
Busch, D.: Domänenspezifische hybride automatische Indexierung von bibliographischen Metadaten (2019)
0.01
0.008988983 = product of:
0.035955932 = sum of:
0.035955932 = weight(_text_:und in 5628) [ClassicSimilarity], result of:
0.035955932 = score(doc=5628,freq=8.0), product of:
0.12236088 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05520786 = queryNorm
0.29385152 = fieldWeight in 5628, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=5628)
0.25 = coord(1/4)
- Abstract
- Im Fraunhofer-Informationszentrum Raum und Bau (IRB) wird Fachliteratur im Bereich Planen und Bauen bibliographisch erschlossen. Die daraus resultierenden Dokumente (Metadaten-Einträge) werden u.a. bei der Produktion der bibliographischen Datenbanken des IRB verwendet. In Abb. 1 ist ein Dokument dargestellt, das einen Zeitschriftenartikel beschreibt. Die Dokumente werden mit Deskriptoren von einer Nomenklatur (Schlagwortliste IRB) indexiert. Ein Deskriptor ist "eine Benennung., die für sich allein verwendbar, eindeutig zur Inhaltskennzeichnung geeignet und im betreffenden Dokumentationssystem zugelassen ist". Momentan wird die Indexierung intellektuell von menschlichen Experten durchgeführt. Die intellektuelle Indexierung ist zeitaufwendig und teuer. Eine Lösung des Problems besteht in der automatischen Indexierung, bei der die Zuordnung von Deskriptoren durch ein Computerprogramm erfolgt. Solche Computerprogramme werden im Folgenden auch als Klassifikatoren bezeichnet. In diesem Beitrag geht es um ein System zur automatischen Indexierung von deutschsprachigen Dokumenten im Bereich Bauwesen mit Deskriptoren aus der Schlagwortliste IRB.