A automatização da legenda, ou seja, a criação da descrição linguística de uma imagem utilizando qualquer processamento em linguagem natural, é uma tarefa difícil. É necessário ter um bom controle tanto no processamento da imagem como no processamento da linguagem natural. Este Livro discute diferentes técnicas disponíveis que modelam a legenda de uma imagem. O avanço da tecnologia em termos de reconhecimento de objetos e aprendizagem de máquinas melhorou muito o desempenho do modelo de legendagem de imagens nos últimos anos. Além disso, vamos tentar abordar as diferentes técnicas e algoritmos para construir este modelo. No final, a avaliação do modelo desempenha um papel importante que será útil para considerar qual o algoritmo que melhor se adapta ao cenário. Há técnicas que podem ser usadas para avaliar o desempenho, como a matriz de confusão, f1-score, mas neste caso, os dados são baseados em linguagem natural, de modo que há um certo tipo especial de tecnologia que pode ser usada, como o Microsoft COCO e o Flickr30K.