Questo libro descrive l'effetto di vari fattori come il tasso di apprendimento, il fattore di sconto e l'epsilon sulla capacità di addestramento del drone per navigare dalla sorgente alla destinazione. Il valore più alto del tasso di apprendimento favorisce l'apprendimento rapido del drone, ma in questo caso c'è il rischio di oscillazione piuttosto che di convergenza, mentre per il valore più basso del tasso di apprendimento il drone impara lentamente ma converge costantemente. Questo libro si concentra principalmente sull'implementazione degli algoritmi di RL per le aree più piccole. Per aree complesse più grandi questi algoritmi sono meno efficienti, quindi l'apprendimento con rinforzo profondo può essere utilizzato in futuro per rendere gli UAV più efficienti per l'implementazione nel mondo reale.