Didascalia immagine

Didascalia dell'immagine con l'apprendimento profondo

Fotogalerie

Kanchana Kannaiyan, Meenatchi R

Didascalia immagine

Didascalia dell'immagine con l'apprendimento profondo

Broschiertes Buch

Jetzt bewerten Jetzt bewerten

Autorenporträt

Andere Kunden interessierten sich auch für

Camila Velasco
Corpo Caeco

26,99 €
Alyona Ryzhkova
Immagine della famiglia

50,99 €
Anoop Balakrishnan Kadan
Rilevamento delle lesioni utilizzando la struttura segmentata della retina

23,99 €
Elena Grinina
Conflitti interpersonali tra gli adolescenti con disabilità intellettuali

50,99 €
Abubakar Ahmed
Il cambiamento climatico e le risorse delle terre aride della Nigeria

35,99 €
Wilfred W.K. Lin
Principi e sfide di un'IA generativa responsabile

31,99 €
Amar Merouani
Fondamenti e prospettive di un nuovo ordine economico africano

26,99 €

Produktbeschreibung

La didascalia delle immagini con l'audio è emersa come un compito impegnativo ma promettente nel campo del deep learning. Il presente lavoro propone un approccio innovativo per affrontare questo compito, integrando reti neurali convoluzionali (CNN) per l'estrazione delle caratteristiche delle immagini e reti neurali ricorrenti (RNN) per l'analisi audio sequenziale. In particolare, utilizziamo CNN pre-addestrate come VGG per estrarre le caratteristiche visive dalle immagini e impieghiamo rappresentazioni dello spettrogramma accoppiate con RNN come LSTM o GRU per elaborare gli input audio. Il modello proposto si basa non solo sul contenuto visivo, ma anche sugli spunti audio che lo accompagnano. Valutiamo le prestazioni del nostro modello su set di dati di riferimento e dimostriamo la sua efficacia nel generare didascalie coerenti e contestualmente rilevanti per le immagini con gli input audio corrispondenti. Inoltre, abbiamo condotto studi di tablatura per analizzare il contributo di ciascuna modalità alle prestazioni complessive delle didascalie. I nostri risultati mostrano che la fusione delle modalità visive e uditive migliora significativamente la qualità delle didascalie rispetto all'utilizzo di una delle due modalità in modo isolato.

Produktdetails

Produktdetails
Verlag: Edizioni Sapienza
Seitenzahl: 64
Erscheinungstermin: 19. Juni 2024
Italienisch
Abmessung: 220mm x 150mm x 4mm
Gewicht: 113g
ISBN-13: 9786207661039
ISBN-10: 6207661036
Artikelnr.: 70983621

Herstellerkennzeichnung

Produktdetails

Verlag: Edizioni Sapienza
Seitenzahl: 64
Erscheinungstermin: 19. Juni 2024
Italienisch
Abmessung: 220mm x 150mm x 4mm
Gewicht: 113g
ISBN-13: 9786207661039
ISBN-10: 6207661036
Artikelnr.: 70983621

Herstellerkennzeichnung

Autorenporträt

Sou a Sra. K.Kanchana, que trabalha como Professora Assistente no Departamento de Informática e Engenharia da Faculdade de Engenharia de Kathir. Estou interessada na área da aprendizagem automática e da aprendizagem profunda