
Más información sobre el libro
Die Dissertation von Lothar Mischke reiht sich in aktuelle Forschungsbestrebungen zur Wahrung des kulturellen Erbes ein, insbesondere durch den Aufbau historischer Teilkorpora zu Literatur bestimmter Epochen, Autoren oder Genres. Ein zentrales Problem sind die altdeutschen Schriftfonts vor 1930, die sich stark unterscheiden und eine automatische Digitalisierung mit gängigen OCR-Programmen erschweren. Zudem variieren die Schreibweisen vor der Rechtschreibreform 1901 erheblich, was die Notwendigkeit spezieller Wörterbücher und Grammatikmodelle für verschiedene Sprachregionen und Epochen mit hohem Aufwand mit sich bringt. Die Arbeit untersucht, ob eine automatisierte Schlagworterkennung in diesen Korpora ohne Volltexterkennung und ohne Spezialwörterbücher möglich ist. Dabei werden intelligente Algorithmen der Bildverarbeitung und Mustererkennung eingesetzt. Die Methodik umfasst die Schlagworterkennung, -lokalisierung und -annotation und bringt neue Erkenntnisse in mehreren Bereichen: Dokumentrestaurierung, Vorklassifikation, Erkennung und Systemerstellung. Ein Erkenner für altdeutsche Fonts wird entwickelt, der neuronale Netze und Support-Vektor-Maschinen nutzt, während ein kontextbasiertes Omnifont-Erkennungssystem auf unüberwachter Clusteranalyse basiert. Die Erkennungsparameter erreichen hohe Werte, und ein optimistisches Kombinationsverfahren zur Schlagwortsuche erzielt in über 90 % der Fälle den besten Treffer.
Compra de libros
Teilautomatisierte Verschlagwortung von in altdeutschen Schriftfonts gesetzten Texten mit Hilfe lernender Verfahren, Lothar Mischke
- Idioma
- Publicado en
- 2007
- product-detail.submit-box.info.binding
- (Tapa blanda)
Métodos de pago
Nadie lo ha calificado todavía.