El etiquetado espontáneo del contenido de una imagen digital es una de las dificultades más importantes en el aprendizaje profundo que une la visualización por ordenador y el idioma inglés. En este trabajo de investigación, se extiende un modelo propagativo basado en una producción profunda recurrente que agrupa las mejoras modernas en la visualización por ordenador y la paráfrasis de artificio y que se puede utilizar para generar veredictos regulares etiquetando una imagen digital. El prototipo se realiza para aprovechar al máximo la probabilidad del veredicto de la explicación objetiva dada la imagen digital que se mantiene en forma. Este trabajo tiene como objetivo generar subtítulos para imágenes utilizando modelos de lenguaje neural. El número de modelos propuestos para la tarea de subtitulación de imágenes digitales ha aumentado considerablemente desde que los modelos de lenguaje neuronal y las redes neuronales convolucionales profundas (CNN) se han hecho populares. Nuestro trabajo se basa en uno de esos trabajos, que utiliza una variante de red neuronal recurrente (RNN) acoplada a una CNN. Pretendemos mejorar este modelo introduciendo sutiles cambios en los bloques de construcción y utilizando frases como unidades elementales en lugar de palabras, lo que puede dar lugar a mejores subtítulos semánticos y sintácticos.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.