Le progrès et l'accessibilité des ordinateurs numériques et l'introduction d'Internet et du World Wide Web ont entraîné une explosion massive de l'information dans le monde entier. Une grande quantité de documents manuscrits, dactylographiés et imprimés contiennent de nombreuses informations et connaissances dans différents domaines. Pour rendre les informations et les connaissances contenues dans ces documents accessibles au public, il est souhaitable de numériser, d'organiser et de développer des systèmes de recherche pour ce type de documents. En réponse à ce besoin, les chercheurs s'orientent vers une approche sans reconnaissance puisque les moteurs de reconnaissance optique de caractères (OCR) présentent diverses limitations.