L'étiquetage spontané du contenu d'une image numérique est une des difficultés les plus importantes de l'apprentissage profond qui associe la visualisation informatique et la langue anglaise. Dans ce travail de recherche, nous présentons un modèle de propagation basé sur une production récurrente profonde qui rassemble les améliorations modernes dans la visualisation informatique et la paraphrase de contrivance et qui peut être utilisé pour générer des verdicts réguliers étiquetant une image numérique. Le prototype est réalisé pour tirer pleinement parti de la probabilité du verdict d'explication objective compte tenu de l'image numérique. Ce travail vise à générer des sous-titres pour les images en utilisant des modèles de langage neuronaux. Le nombre de modèles proposés pour le sous-titrage d'images numériques a considérablement augmenté depuis que les modèles de langage neuronal et les réseaux neuronaux convolutifs profonds (CNN) se sont répandus. Notre travail est basé sur l'un de ces travaux, qui utilise une variante du réseau neuronal récurrent (RNN) couplé à un CNN. Nous avons l'intention d'améliorer ce modèle en apportant des changements subtils aux blocs de construction et en utilisant des phrases comme unités élémentaires au lieu de mots, ce qui peut conduire à de meilleurs sous-titres sémantiques et syntaxiques.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno