La description et l'annotation sémantiques des images numériques sont la clé de la gestion et de la réutilisation des images dans l'informatique des sciences humaines. En raison de l'absence de schéma de description hiérarchique spécifique au domaine et de vocabulaire contrôlé pour les images numériques, les résultats d'annotation produits par les méthodes actuelles, telles que l'annotation automatique basée sur les caractéristiques visuelles de bas niveau des images et l'annotation humaine basée sur l'expérience des experts, présentent des problèmes de faible qualité et d'incohérence. Pour résoudre ce problème, nous proposons un cadre de description sémantique pour le contenu de DeepL basé sur les besoins en information et la théorie de la recherche. Ce cadre combine un cadre de description sémantique et un thésaurus de domaine. Dans cet article, nous expliquons la relation entre les niveaux sémantiques dans ce cadre de description. Ensuite, nous effectuons un test préliminaire avec cette méthode dans le domaine du patrimoine culturel en utilisant l'image numérique de la fresque de Dunhuang. Nous discutons de l'effet de la granularité sémantique sur le coût de l'annotation du point de vue de la granularité de la description sémantique de l'image et des stratégies de contrôle de la qualité de la description sémantique d'une image.