Abbyy mit Weltpremiere: Erste Omnifont OCR-Software zur Erkennung von Frakturschrift

(PresseBox) () Neues Erkennungsmodul ermöglicht Digitalisierung wichtiger historischer Dokumente


München, 24. März 2003 - Abbyy stellt eine neue Technologie vor, welche die Archivierung alter Dokumente und Bücher wesentlich erleichtert. Der führende Anbieter linguistischer und Optical Character Recognition (OCR)-Software präsentiert die erste Omnifont OCR-Software zur Erkennung von Frakturschrift. Nach mehr als zwei Jahren Entwicklungszeit erkennt das FineReader Modul für Frakturschrift historische Texte in Deutsch, Nieder-ländisch und den skandinavischen Sprachen. Zusätzlich zu den kunstvollen und kalligrafischen Frakturschriften liest das neue Modul von ABBYY auch alte romanische Zeichen wie das verlängerte "s" in frühen englischen und französischen Texten.

Bisher war die Digitalisierung historischer Dokumenten eine teure und aufwändige Angelegenheit. Die Grenzen der Technologie und die Einzig-artigkeit der Dokumente, die in vielen verschiedenen historischen Schriften erstellt wurden, haben den Prozess der Texterkennung erschwert. Zwar konnten auch auf diesem Sektor OCR-Technologien in den letzten Jahren bessere Erkennungsraten erzielen und auch die Computer selbst wurden "intelligenter" und konnten so trainiert werden, dass sie kursive Schriften erkennen. Dennoch benötigten die meisten Systeme immer noch viele Stunden Training mit dem Wörterbuch, um ein einzelnes Dokument mit alten Schriftarten zu erkennen.

Erkennung alter Texte ohne langes Training Das ABBYY FineReader Modul für Frakturschrift ist das erste Omnifont OCR-System zur Erkennung von Fraktur-schrift. Anwender können jetzt Dokumente mit Frakturschrift einfach scannen und erkennen lassen. Die Texte können mit nur geringem Training und mini-maler Arbeit mit dem Wörterbuch digitalisiert werden. Das ermöglicht Abbyy durch den Einsatz eines speziellen Klassifizierers für Frakturschrift. Um eine hohe Genauigkeit zu erreichen, wurde das Frakturmodul mit Hunderten von Beispieldokumenten aus dem 19. und vom Beginn des 20. Jahrhunderts trainiert. Spezielle Wörterbücher wurden auf der Grundlage von Original-wörterbüchern mit der Orthographie des 19. und 20. Jahrhunderts für Deutsch, Englisch, Französisch, Italienisch und Spanisch entwickelt.

Erste Implementierung im METAe Projekt Im Laufe dieses Jahres wird die erste Implementierung eines Archivierungssystems mit Abbyys Omnifont OCR für Fraktur im METAe Projekt durchgeführt werden. METAe ist ein Konsortium von Bibliotheken und Digitalisierungsunternehmen aus ganz Europa, die eine Software-Lösung zur Archivierung und Umwandlung historischer Dokumente wie Bücher, Zeitschriften, Magazine und Zeitungen erstellen. Das FineReader Modul wird dabei die Hauptkomponente für die Archivierung der kostbarsten historischen Dokumente Europas darstellen. Partner im METAe Projekt sind unter anderen: Die Universität von Innsbruck, die Universität von Florenz, die Nationalbibliothek von Frankreich, die Nationalbibliothek von Norwegen, die Friedrich-Ebert-Stiftung, CCS Compact Computer Systeme (Deutschland) und die Cornell Library Universität (USA).

Hintergrund: Frakturschrift Frakturschrift ist eine alte kalligrafi-sche/kursive Schrift und eine deutsche Ableitung der gotischen Schrift, die Künstler der Renaissance gebraucht hatten und die auch für die Bibliothek des Kaisers Maximilian I. und verschiedene religiöse Publikationen ver-wendet wurde. Sie war zwischen der Mitte des 15. Jahrhunderts und dem Beginn des 20. Jahrhunderts gebräuchlich. Der Ausdruck "Frakturschrift" leitet sich aus dem Lateinischen ab und bedeutet gebrochene Schrift, weil die Verziehrungen der Buchstaben den Wortfluss unterbrechen. Außer in Deutschland wurde Frakturschrift auch in anderen Ländern Mittel- und Nordeuropas verwendet: Dänemark, Schweden, Slowakei, Tschechien und Lettland. Andere Sprachen wie etwa Italienisch, Französisch und Spanisch verwendeten ebenfalls Fraktur-verwandte Ableitungen der gotischen Schrift. Beispielsatz für Frakturschrift:


Preise und Verfügbarkeit: Das FineReader Modul für Fraktur wird als Add-On Modul für FineReader Corporate Edition, FineReader Scripting Edition oder FineReader Engine angeboten. Das Modul kann nach Terminabsprache in der a-Version vorgeführt werden und wird in der zweiten Jahreshälfte 2003 zum Kauf angeboten. Der Preis ist Projekt-abhängig.


Weitere Informationen:
ABBYY Europe GmbH
Paula Fujimoto
Anglerstraße 6
D - 80339 München
Tel.: 089/511 159-55
Fax: 089/511 159-59
E-Mail: fujimoto@abbyyeu.com

Pressekontakt:
AxiCom GmbH
Detlev Henning
Junkersstraße 1
D - 82178 Puchheim
Tel.: 089/800908-14
Fax: 089/800908-10
E-Mail: detlev.henning@axicom.de

Kontakt

ABBYY Europe GmbH
Landsberger Str. 300
D-80687 München
Social Media