A HAR é um domínio de investigação relacionado com a deteção voluntária de actividades diárias realizadas por pessoas com base em dados de séries temporais utilizando sensores. A HAR consiste em vários domínios, como a vigilância, a monitorização de bebés, os cuidados de saúde a idosos e a condução inteligente de automóveis, utilizando diferentes abordagens para resolver problemas de forma eficiente e precisa. Os sistemas HAR tradicionais utilizam sensores portáteis, como unidades de medição inercial (IMU) e sensores de alongamento, para reconhecer a atividade.Esta abordagem apresenta resultados notáveis para actividades básicas do utilizador, como estar sentado, estar de pé e andar. Mas para actividades complexas, como correr, saltar, lutar e balançar, os sistemas HAR baseados em sensores apresentam taxas de erro de classificação mais elevadas devido a erros de leitura dos sensores. Estes erros dos sensores têm os piores resultados de classificação possíveis e reduzem o desempenho global do sistema HAR. Utilizando uma combinação de CNN e LSTM, os dados serão extraídos e processados a partir de vídeos. Neste livro, é proposta uma rede neural convolucional profunda, através da qual são extraídas as características para a recolha dos dados da sequência de entrada (vídeo). Em seguida, a LSTM será utilizada para determinar as relações temporais entre as imagens.