Der Fortschritt und die Zugänglichkeit digitaler Computer sowie die Einführung des Internets und des World Wide Web haben zu einer massiven Informationsexplosion in der ganzen Welt geführt. Große Mengen handschriftlicher, maschinengeschriebener und gedruckter Dokumente enthalten zahlreiche Informationen und Wissen aus verschiedenen Bereichen. Um die Informationen und das Wissen, das in diesen Dokumenten enthalten ist, der Öffentlichkeit zugänglich zu machen, ist es wünschenswert, diese Dokumente zu digitalisieren, zu organisieren und Abfragesysteme dafür zu entwickeln. Als Antwort auf diesen Bedarf bewegen sich die Forscher in Richtung eines erkennungsfreien Ansatzes, da OCR-Engines zur optischen Zeichenerkennung verschiedene Einschränkungen aufweisen.