L'HAR è un campo di ricerca legato al rilevamento volontario delle attività quotidiane svolte dalle persone sulla base di serie temporali di dati che utilizzano sensori. L'HAR comprende vari ambiti, come la sorveglianza, il monitoraggio dei bambini, l'assistenza sanitaria agli anziani e la guida intelligente delle automobili, utilizzando diversi approcci per risolvere i problemi in modo efficiente e accurato. I sistemi HAR tradizionali utilizzano sensori indossabili come le unità di misura inerziali (IMU) e i sensori di allungamento per riconoscere le attività.Questo approccio mostra risultati notevoli per le attività di base dell'utente, come stare seduti, in piedi e camminare. Tuttavia, per attività complesse come la corsa, il salto, la lotta e l'oscillazione, i sistemi HAR basati su sensori presentano tassi di classificazione errati più elevati a causa degli errori di lettura dei sensori. Questi errori del sensore comportano i peggiori risultati di classificazione possibili e riducono le prestazioni complessive del sistema HAR. Utilizzando una combinazione di CNN e LSTM, i dati vengono estratti ed elaborati dai video. In questo libro viene proposta una rete neurale convoluzionale profonda, con la quale vengono estratte le caratteristiche per la raccolta dei dati dalla sequenza di ingresso (video). Successivamente si utilizzerà LSTM per determinare le relazioni temporali tra le immagini.