-
Altenhöner, R.; Brantl, M.; Ceynowa, K.: Digitale Langzeitarchivierung in Deutschland : Projekte und Perspektiven (2011)
0.01
0.014844406 = product of:
0.059377626 = sum of:
0.059377626 = weight(_text_:und in 151) [ClassicSimilarity], result of:
0.059377626 = score(doc=151,freq=24.0), product of:
0.11666329 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05263717 = queryNorm
0.5089658 = fieldWeight in 151, product of:
4.8989797 = tf(freq=24.0), with freq of:
24.0 = termFreq=24.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=151)
0.25 = coord(1/4)
- Abstract
- Der Beitrag beschreibt die derzeit maßgeblichen, kooperativen Projekte und Konzepte der digitalen Langzeitarchivierung in Deutschland im Spannungsfeld öffentlich geförderter und kommerzieller Lösungsansätze. Im ersten Teil werden Stand und Entwicklungsperspektiven der Langzeitarchivierung in der Deutschen Nationalbibliothek vorgestellt. Im Mittelpunkt der Darstellung stehen die Erfahrungen und Ergebnisse aus Kooperationen mit kommerziellen und öffentlich-rechtlichen Partnern sowie die Bestimmung des spezifischen Beitrags der Deutschen Nationalbibliothek zur Infrastruktur der digitalen Langzeitarchivierung insgesamt. Der zweite Teil stellt den Weg der Bayerischen Staatsbibliothek mit ihrem Münchener Digitalisierungszentrum und dem Bibliotheksverbund Bayern von der explorativen zu einer auf den Regelbetrieb der Verarbeitung großer Datenvolumina angelegten digitalen Langzeitarchivierung und den damit verbundenen organisatorischen und technischen Herausforderungen dar. Es wird beschrieben, wie fortgeschrittene Digitalisierungstechnologien, zum Beispiel der Einsatz von Scanrobotik, und groß angelegte Projekte der Massendigitalisierung einerseits und die Anforderungen an Softwaresysteme zur Langzeitarchivierung andererseits sich gegenseitig bedingen.
- Source
- Zeitschrift für Bibliothekswesen und Bibliographie. 58(2011) H.3/4, S.182-196
-
Brantl, M.; Ceynowa, K.; Meiers, T.; Wolf, T.: Visuelle Suche in historischen Werken (2017)
0.01
0.010100339 = product of:
0.040401354 = sum of:
0.040401354 = weight(_text_:und in 3467) [ClassicSimilarity], result of:
0.040401354 = score(doc=3467,freq=16.0), product of:
0.11666329 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05263717 = queryNorm
0.34630734 = fieldWeight in 3467, product of:
4.0 = tf(freq=16.0), with freq of:
16.0 = termFreq=16.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0390625 = fieldNorm(doc=3467)
0.25 = coord(1/4)
- Abstract
- Die Bayerische Staatsbibliothek (BSB) zählt mit ihrem Bestand von knapp 11 Mio. Bänden zu den bedeutendsten Universalbibliotheken der Welt. Bereits 1,2 Mio. Werke sind digitalisiert, was die BSB zur größten digitalen Kulturinstitution in Deutschland macht. Dieser digitale Bestand umfasst vorwiegend urheberrechtsfreie Werke vom 8. bis ins 20. Jahrhundert, von der mittelalterlichen Bibelhandschrift bis zur Boulevardzeitung der 1920er-Jahre. Diese Vielfalt des zu digitalisierenden schriftlichen Kulturerbes und das hohe Tempo der Massendigitalisierung in den letzten Jahren haben ihren Preis - die inhaltliche Erschließung der Werke hinkt hinterher, insbesondere bei Werken, die nicht mittels Optical Character Recognition-Verfahren (OCR) automatisiert maschinenlesbar transformiert und zugänglich gemacht werden können. Dies gilt insbesondere für mittelalterliche Handschriften, Alte Druck- und Spezialbestände. Deshalb blieb auch der reichhaltige, in diesen Werken verborgene Bildbestand für den Nutzer weitestgehend verborgen und konnte lediglich durch das Durchblättern am Bildschirm entdeckt werden. Dies war Motivation für die Bayerische Staatsbibliothek, gemeinsam mit dem Fraunhofer Heinrich-Hertz-Institut in Berlin ein System zur ähnlichkeitsbasierten Bildsuche aufzubauen, welches sämtliche Bildinhalte aller 1,2 Mio. Digitalisate automatisch identifiziert. Hierbei werden mittels morphologischer Verfahren Bilder aus den Buchseiten extrahiert, die danach aufgrund von Farb- und Kantenmerkmalen klassifiziert werden. Bilder "ohne Informationswert" werden mit Hilfe von Methoden aus dem Bereich des maschinellen Lernens herausgefiltert. Damit konnten aus den digitalisierten Werken der BSB bislang mehr als 43 Mio. einzelne Bilder identifiziert werden, die mittels einer hochperformanten Suchmaschine über eine frei verfügbare Web-Applikation dem Anwender direkt zur Verfügung stehen. Dank der Vielfalt und Reichhaltigkeit der indexierten Bestände spricht dieses Angebot nicht nur Historiker und Buchwissenschaftler an, sondern Interessierte aus den unterschiedlichsten Fachrichtungen. Die Ähnlichkeitssuche stellt dabei unbekannte, ungewöhnliche und oftmals überraschende Bezüge zwischen unterschiedlichsten Werken her.
-
Brantl, M.; Ceynowa, K.; Fabian, C.; Messmer, G.; Schäfer, I.: Massendigitalisierung deutscher Drucke des 16. Jahrhunderts : ein Erfahrungsbericht der Bayerischen Staatsbibliothek (2009)
0.01
0.009582023 = product of:
0.038328093 = sum of:
0.038328093 = weight(_text_:und in 188) [ClassicSimilarity], result of:
0.038328093 = score(doc=188,freq=10.0), product of:
0.11666329 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05263717 = queryNorm
0.328536 = fieldWeight in 188, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=188)
0.25 = coord(1/4)
- Abstract
- Der Beitrag stellt differenziert die von 2006 bis Juni 2009 gesammelten, praxiserprobten Erfahrungen und Projektergebnisse der Bayerischen Staatsbibliothek bei der Digitalisierung von über 20.000 im deutschen Sprachbereich erschienenen Drucken des 16. Jahrhunderts im Rahmen der von der DFG aufgelegten Aktionslinie zur Digitalisierung der in VD16 und VD17 erschlossenen Drucke dar. Ziel der Projekte ist es, jede im VD16 mit Bestand der Bayerischen Staatsbibliothek nachgewiesene Ausgabe in einem Exemplar zu digitalisieren. Der Digitalisierungsprozess wird im Hinblick auf konservatorische Vorgaben für buchschonendes, objektadäquates Arbeiten optimiert. Seit 2007 wird Scanrobotertechnik für die Digitalisierung dieses Bestands eingesetzt. Der Beitrag bietet detaillierte Projekterkenntnisse - sowohl hinsichtlich der differenzierten Materialität der Objekte wie auch in der Auswirkung auf eine Angleichung und Verbesserung der Technik - und Leistungszahlen, die es erlauben, die Kosten für Altbestandsdigitalisierung korrekt zu ermitteln. Es wird deutlich, dass grundsätzlich nahezu jedes Buch des historischen Altbestands digitalisiert werden kann,jedoch objektbezogen je andere Verfahren unterschiedlichen Durchsatzes angewendet werden müssen, was unmittelbare Auswirkungen auf die Kosten dieser Aktivitäten hat.
- Source
- Zeitschrift für Bibliothekswesen und Bibliographie. 56(2009) H.6, S.327-338
-
Kempf, K.; Brantl, M.; Meiers, T.; Wolf, T.: Auf der Suche nach dem verborgenen Bild : Künstliche Intelligenz erschließt historische Bibliotheksbestände (2021)
0.01
0.009582023 = product of:
0.038328093 = sum of:
0.038328093 = weight(_text_:und in 218) [ClassicSimilarity], result of:
0.038328093 = score(doc=218,freq=10.0), product of:
0.11666329 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05263717 = queryNorm
0.328536 = fieldWeight in 218, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=218)
0.25 = coord(1/4)
- Abstract
- Seit 23 Jahren werden im Münchener Digitalisierungszentrum (MDZ) die reichhaltigen und weltweit einzigartigen Sammlungen der Bayerischen Staatsbibliothek (BSB) digitalisiert und online bereitgestellt. Was 1997 als experimentelles Projekt mit Anschubfinanzierung der Deutschen Forschungsgemeinschaft begann, ist binnen weniger Jahre zu einem der wichtigsten Geschäftsgänge der Bayerischen Staatsbibliothek geworden. Durch die Zusammenarbeit mit Google wurde der digitale Bestandsaufbau seitdem Jahr 2007 stark erweitert. Die Anzahl der digitalisierten Werke stieg von einigen zehntausend auf aktuell über 2,5 Millionen. Der größte Teil des Altbestandes vor 1900 und damit rund ein Zehntel des Gesamtbestandes der Bibliothek ist inzwischen auch in digitaler Form verfügbar. Dabei handelt es sich um Werke aus zwölf Jahrhunderten. Von koptischen Papyri des 6. Jahrhunderts über mittelalterliche Handschriften, neuzeitliche Inkunabeln bis hin zu Druckwerken des späten 19. und frühen 20. Jahrhunderts ist alles dabei.
- Issue
- Teil 1: Die Motivation, die Herausforderungen, Automatisierte Trennung von Texten und Bildern.
-
Kempf, K.; Brantl, M.; Meiers, T.; Wolf, T.: Auf der Suche nach dem verborgenen Bild : Künstliche Intelligenz erschließt historische Bibliotheksbestände (2021)
0.01
0.0085704215 = product of:
0.034281686 = sum of:
0.034281686 = weight(_text_:und in 147) [ClassicSimilarity], result of:
0.034281686 = score(doc=147,freq=8.0), product of:
0.11666329 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05263717 = queryNorm
0.29385152 = fieldWeight in 147, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=147)
0.25 = coord(1/4)
- Abstract
- Die von den Nutzern hochgeladenen Bilder werden nicht in den Bestand eingebracht; nach einmaliger Verwendung für eine Suche werden Uploads umgehend wieder gelöscht. Die Upload-Option gehört zu den beliebtesten Funktionen des Online-Angebotes. Das Frontend bietet zudem eine Konfigurationsmöglichkeit zur Gewichtung der Suchparameter. So kann der Schwerpunkt auf die Farb- oder die Kantenmerkmale verschoben werden. Die besten Treffer ergeben sich bei einem ausgewogenen Verhältnis von Farb- und Kantenmerkmalen. Eine Suche nach reiner Farbähnlichkeit ergibt allerdings keinen Sinn, da Farbe allein kein ausreichendes Ähnlichkeitskriterium ist. Durch Vorgabe eines Schwellenwertes (zwischen 0,1 und 1,0) lässt sich bestimmen, wie stark die Ergebnisbilder vom Suchbild abweichen sollten. Je niedriger der Wert, desto größer die zulässigen Differenzen. Hierbei ergeben sich die besten Treffer bei einem Wert zwischen 0,85 und 0,95.
- Issue
- Teil 3: Upload-Funktion - Grenzen der Bildähnlichkeitssuche - Fazit und Perspektiven.
-
Kempf, K.; Brantl, M.; Meiers, T.; Wolf, T.: Auf der Suche nach dem verborgenen Bild : Künstliche Intelligenz erschließt historische Bibliotheksbestände (2021)
0.01
0.0070702373 = product of:
0.02828095 = sum of:
0.02828095 = weight(_text_:und in 224) [ClassicSimilarity], result of:
0.02828095 = score(doc=224,freq=4.0), product of:
0.11666329 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.05263717 = queryNorm
0.24241515 = fieldWeight in 224, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0546875 = fieldNorm(doc=224)
0.25 = coord(1/4)
- Abstract
- Extraktion visueller Merkmale. Basis der Bildähnlichkeitssuche sind die unterschiedlichen visuellen Eigenschaften eines Bildes, seine spezifischen Farb- und Kanteninformationen, welche zunächst in geeigneter Weise erfasst und codiert werden müssen. Dabei kommen sogenannte Deskriptoren zum Einsatz. Die visuelle Information eines Bildes wird in sehr komprimierter Form gespeichert. In unserem Fall hat der zu einem Bild gehörende Deskriptor einen Umfang von nur 96 Byte. Der visuelle Deskriptor codiert sowohl die Farbeigenschaften als auch die spezifischen Kantenmerkmale.