Este livro descreve o efeito de vários factores, como a taxa de aprendizagem, o fator de desconto e o epsilon, na capacidade de treino do drone para navegar da origem ao destino. O valor mais elevado da taxa de aprendizagem incentiva a aprendizagem rápida do drone, mas existe o risco de oscilação em vez de convergência e, para o valor mais baixo da taxa de aprendizagem, o drone aprende lentamente, mas converge de forma constante. Este livro centra-se principalmente na implementação dos algoritmos de RL para áreas mais pequenas. Para áreas complexas maiores, estes algoritmos são menos eficientes, pelo que a aprendizagem por reforço profundo pode ser utilizada no futuro para tornar o UAV mais eficiente para a implementação no mundo real.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.