As imagens são capturadas por uma variedade de dispositivos físicos, incluindo câmaras fotográficas e de vídeo, scanners, dispositivos de raios X, microscópios electrónicos, radares e ultra-sons, e são utilizadas para diversos fins, incluindo entretenimento, médicos, comerciais, industriais, militares, civis, de segurança, e científicos. O interesse no processamento digital de imagens é que os investigadores estão a pensar em conceber um sistema tão inteligente como o cérebro humano. Embora existam muitas aplicações para o processamento de imagem e reconhecimento de padrões, o nosso foco neste livro é a imagem que tem informação de texto, para compreender a imagem com a ajuda do Optical Character Recognizer (OCR), que por sua vez ajuda na indexação e recuperação da semântica a partir da base de dados de imagens. Este problema desperta o interesse de muitos investigadores devido à procura por aplicações do mundo real, o reconhecimento e compreensão do texto na imagem desempenha um papel vital. Entretanto, devido à natureza do texto da cena que pode variar largamente em fontes, tamanho da fonte, fundos, contraste, orientação e outras distorções, o problema do texto na imagem da cena tornou-se complexo e desafiante. Assim, a detecção e reconhecimento de texto em cena continua a ser um problema em aberto.