Les médias sociaux sont présents dans tous les domaines de notre vie. Les multimédias partagés via les réseaux sociaux permettent à leurs utilisateurs de les partager, de les annoter et de les évaluer en fonction de leurs préférences et ils sont hautement personnalisés. Ces annotations sociales générées par l'utilisateur sont plus utiles pour décrire le contenu du multimédia et permettre une indexation et une recherche efficaces. Les techniques d'extraction multimédia manquent d'annotations sémantiques pour les vidéos, car l'annotation sémantique des vidéos à l'aide de méthodes automatiques est une tâche difficile. Ce livre traite de nouvelles méthodes d'affinement des étiquettes vidéo et de localisation temporelle pour les multimédias culturels en exploitant la similarité visuelle, la cohérence temporelle, les caractéristiques spatiales et l'affinement des annotations basées sur les régions de la vidéo. Ainsi, les annotations sociales générées par les utilisateurs des médias sociaux peuvent être incorporées dans le multimédia pour augmenter l'efficacité et la précision des méthodes d'extraction.