Pie de foto

Pie de foto

Leyenda de imágenes mediante aprendizaje profundo

Versandkostenfrei!
Versandfertig in 1-2 Wochen
29,99 €
inkl. MwSt.
PAYBACK Punkte
15 °P sammeln!
El subtitulado de imágenes con audio ha surgido como una tarea desafiante pero prometedora en el campo del aprendizaje profundo. Este artículo propone un enfoque novedoso para abordar esta tarea mediante la integración de redes neuronales convolucionales (CNN) para la extracción de características de imagen y redes neuronales recurrentes (RNN) para el análisis secuencial de audio. En concreto, aprovechamos CNNs preentrenadas como VGG para extraer características visuales de las imágenes y empleamos representaciones de espectrogramas acopladas a RNNs como LSTM o GRU para procesar entrad...