Tabellen finden sich in fast jedem Medium wieder. In Zeitungen, Büchern, Rechnungen oder in elektronischen Medien vermitteln sie dem Leser Daten in strukturierter Form, die aus bloßem Text weitaus schwieriger ersichtlich sind. Wie die Tabellen repräsentiert werden, ist für den Menschen irrelevant - denn nahezu ohne Schwierigkeiten ist er in der Lage, deren Strukturen zu erkennen und aufzunehmen. Automatische Prozesse müssen sich hingegen mühsam an verschiedenen Informationsquellen bedienen, um die Datenstruktur verstehen zu können. Die Menge an verschiedenen Dokumententypen und die verschiedenen Arten von Tabellenlayouts erschweren den Prozess einer automatischen Tabellenerkennung zusätzlich. Ein formatübergreifender Austausch von tabellarischen Strukturen, selbst bei den gängigsten Dokumentarten, wird nicht unterstützt. Insbesondere der Transfer von Tabellen aus pixelbasierten Dokumente fehlt. Eine besondere Herausforderung besteht folglich darin, Tabellen aus verschiedenen Dokumentarten einheitlich abzulegen. Diese Arbeit beschreibt die Entwicklung eines Modells, worin tabellenförmige Daten dokumentübergreifend abgelegt werden können.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.