Die spontane Kennzeichnung des Inhalts eines digitalen Bildes ist eine der wichtigsten Schwierigkeiten beim Deep Learning, das die Computervisualisierung und die englische Sprache miteinander verbindet. In dieser Forschungsarbeit haben wir ein propagatives Modell entwickelt, das auf einer tiefen, wiederkehrenden Produktion basiert, die moderne Verbesserungen in der Computervisualisierung und in der Umschreibung von Erfindungen zusammenfasst, und das verwendet werden kann, um regelmäßige Urteile zur Kennzeichnung eines digitalen Bildes zu erzeugen. Das Prototypische wird durchgeführt, um die Wahrscheinlichkeit des objektiven Erklärungsurteils angesichts des passenden digitalen Bildes voll auszunutzen. Diese Arbeit zielt auf die Generierung von Untertiteln für Bilder unter Verwendung neuronaler Sprachmodelle ab. Die Zahl der vorgeschlagenen Modelle für die Untertitelung digitaler Bilder ist stark angestiegen, seit neuronale Sprachmodelle und tiefe Faltungsneuronale Netze (CNN) sichdurchgesetzt haben. Unsere Arbeit basiert auf einer dieser Arbeiten, die eine Variante des rekurrenten neuronalen Netzes (RNN) in Verbindung mit einem CNN verwendet. Wir beabsichtigen, dieses Modell zu verbessern, indem wir subtile Änderungen an den Bausteinen vornehmen und Phrasen als elementare Einheiten anstelle von Wörtern verwenden, was zu besseren semantischen und syntaktischen Untertiteln führen kann.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno