O avanço e acessibilidade dos computadores digitais e a introdução da Internet e da World Wide Web resultaram numa explosão maciça de informação em todo o mundo. Uma grande quantidade de documentos manuscritos, dactilografados e impressos contém numerosas informações e conhecimentos de diferentes áreas. Para tornar a informação e o conhecimento incorporados nestes documentos acessíveis ao público, é desejável digitalizar, organizar e desenvolver sistemas de recuperação para este tipo de documentos. Em resposta a esta necessidade, os investigadores estão a avançar para uma abordagem sem reconhecimento, uma vez que os motores de OCR de reconhecimento óptico de caracteres têm várias limitações.