Design und Implementierung eines Multi-Classifier-Systems (MCS) für die Erkennung von gerendertem Text

Leseprobe

Fotogalerie

Stefan Fleischer

Design und Implementierung eines Multi-Classifier-Systems (MCS) für die Erkennung von gerendertem Text

Broschiertes Buch

Jetzt bewerten Jetzt bewerten

Weitere Ausgabe:
eBook, PDF

Leseprobe

Andere Kunden interessierten sich auch für

Produktbeschreibung

Diplomarbeit aus dem Jahr 2007 im Fachbereich Informatik - Programmierung, Note: 1,0, Westfälische Wilhelms-Universität Münster (Institut für Informatik (Computer Vision and Pattern Recognition Group)), 35 Quellen im Literaturverzeichnis, Sprache: Deutsch, Abstract: Ziel dieser Arbeit ist es, die Klassifikationskomponente des am Institut für Informatik entwickelten OCR-Systems zur Erkennung von gerendertem Text durch die Implementierung eines Multi-Classifier-Systems (MCS) weiter zu optimieren.

Diese Arbeit befasst sich mit dem Design und der Implementierung eines Multi-Classifier-Systems, das mehrere verschiedene Klassifikatoren zur Erkennung gerenderter Schriftzeichen kombiniert. Das MCS wird schließlich in das existierende OCR-System integriert, um dessen Effektivität zu verbessern.

Kapitel 2 befasst sich zunächst mit Analyse und Beurteilung des vorliegenden OCR-Systems. Kapitel 2.1 identifiziert hierzu konkrete Eigenschaften gerenderter Texte und die damit einhergehenden
Herausforderungen bei der automatischen Texterkennung. Kapitel 2.2 stellt das bestehende OCR-Systems zur Erkennung von gerendertem Text vor, dessen Komponenten in Kapitel 2.3 analysiert werden, um das weitere Vorgehen im Hinblick auf das Ziel dieser Arbeit zu planen.
Kapitel 3 befasst sich mit der Schaffung der für die Entwicklung des MCS notwendigen Voraussetzungen. Das betrifft insbesondere die dem OCR-System zu Grunde liegenden Trainingsdaten, auf deren Basis es entwickelt und getestet wurde. In Kapitel 3.1 wird dafür zun achst eine Kategorisierung von gerendertem Text vorgenommen, anhand der sich die Zusammensetzung bereits existierender Trainingsdaten untersuchen l asst. Damit die Trainingsdaten in einem sinnvollen Format vorliegen, wurde die Datenhaltung uberarbeitet. Kapitel 3.2 stellt diese überarbeitung vor. Die identifizierten Kategorien werden dann herangezogen, um in Kapitel 3.3 eine strategische Erweiterung der Datenbasis vorzunehmen.
Kapitel 4 leitet zum Kern der Arbeit über: Auf Basis der Trainingsdaten werden verschiedene Klassifikatoren konstruiert. Um qualifizierte Klassifikatoren konstruieren zu können, ist das
Vorhandensein geeigneter Merkmale entscheidend, anhand der sich die Schriftzeichen klassifizieren lassen. Kapitel 4.1 identifiziert solche Merkmale und konstruiert auf deren Grundlage eine Reihe
von Klassifikatoren. Kapitel 5 befasst sich schließlich mit einer gruppenweisen Kombination der konstruierten Klassifikatoren,
um durch Ausnutzung der Vorteile verschiedener Klassifikatoren einen positiven Beitrag zur Erhöhung der Erkennungsgenauigkeit zu erhalten und somit die Effektivität des bestehenden OCR-Systems zu verbessern.

Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.

Produktdetails

Produktdetails
Akademische Schriftenreihe Bd.V117720
Verlag: GRIN Verlag
1. Auflage
Seitenzahl: 112
Erscheinungstermin: 28. Oktober 2013
Deutsch
Abmessung: 210mm x 148mm x 9mm
Gewicht: 174g
ISBN-13: 9783656524717
ISBN-10: 3656524718
Artikelnr.: 39734983

Herstellerkennzeichnung
Books on Demand GmbH
In de Tarpen 42
22848 Norderstedt
info@bod.de
040 53433511

Produktdetails

Akademische Schriftenreihe Bd.V117720
Verlag: GRIN Verlag
1. Auflage
Seitenzahl: 112
Erscheinungstermin: 28. Oktober 2013
Deutsch
Abmessung: 210mm x 148mm x 9mm
Gewicht: 174g
ISBN-13: 9783656524717
ISBN-10: 3656524718
Artikelnr.: 39734983

Herstellerkennzeichnung
Books on Demand GmbH
In de Tarpen 42
22848 Norderstedt
info@bod.de
040 53433511