Il rilevamento umano da un video basato su droni ha molte applicazioni potenziali come la ricerca di persone scomparse, la sorveglianza di immigrati illegali e il monitoraggio di infrastrutture critiche. Tuttavia, è un problema di computer vision molto impegnativo da affrontare. Le difficoltà sono legate a molti aspetti tra cui le variazioni nella vista della telecamera, i cambiamenti di illuminazione e le condizioni atmosferiche, nonché le variazioni negli oggetti circostanti. Recentemente, i sistemi di visione basati sul deep learning hanno dimostrato un grande successo in molti problemi di rilevamento degli oggetti. Pertanto, questo lavoro mira a sviluppare un sistema di visione basato sull'apprendimento profondo applicato al problema del rilevamento umano dai video catturati da una telecamera basata su droni. In particolare, il sistema presentato comprende un approccio di rilevamento che consiste nel modello di apprendimento profondo Faster R-CNN per rilevare l'uomo nelle immagini catturate da un drone. Per valutare le prestazioni del modello di visione proposto, sono stati registrati vari video con il drone in diversi luoghi, da varie viste e in varie condizioni atmosferiche. I risultati mostrano l'efficacia del sistema proposto per il rilevamento umano nei video basati su droni.