La détection humaine à partir de vidéos prises par des drones a de nombreuses applications potentielles telles que la recherche de personnes disparues, la surveillance d'immigrants illégaux et la surveillance d'infrastructures critiques. Cependant, il s'agit d'un problème de vision par ordinateur très difficile à résoudre. Les difficultés sont liées à de nombreux aspects, notamment les variations de la vue de la caméra, les changements d'éclairage et les conditions météorologiques, ainsi que les variations des objets environnants. Récemment, les systèmes de vision basés sur l'apprentissage profond ont connu un grand succès dans de nombreux problèmes de détection d'objets. Par conséquent, ce travail vise à développer un système de vision basé sur l'apprentissage profond qui est appliqué au problème de la détection humaine à partir de vidéos capturées par un drone. En particulier, le système présenté comprend une approche de détection qui consiste en un modèle d'apprentissage profond R-CNN plus rapide pour détecter l'homme dans les images capturées par un drone. Pour évaluer les performances du modèle de vision proposé, plusieurs vidéos ont été enregistrées à l'aide d'un drone à différents endroits, sous différentes vues et dans différentes conditions météorologiques. Les résultats montrent l'efficacité du système proposé pour la détection humaine dans les vidéos prises par les drones.