Obuchenie s primeneniem podkrepleniq

Obuchenie s primeneniem podkrepleniq

Kniga nowogo pokoleniq

Versandkostenfrei!
Versandfertig in 6-10 Tagen
19,99 €
inkl. MwSt.
PAYBACK Punkte
10 °P sammeln!
Jeta kniga sostoit iz pqti razdelow, obespechiwaüschih celostnyj process obucheniq. Puteshestwie nachinaetsq s wwedeniq w banditskie algoritmy, izucheniq osnownyh koncepcij, takih kak werhnqq doweritel'naq granica (UCB) i algoritmy weroqtnogo priblizheniq k prawil'nym (PAC). Sleduüschij razdel predstawlqet polnuü strukturu Reinforcement Learning (RL), wyhodqschuü za ramki banditskih algoritmow i rassmatriwaüschuü wzaimodejstwie agenta i sredy na neskol'kih wremennyh shagah. Markowskie processy prinqtiq reshenij (MPP) rassmatriwaütsq kak fundamental'naq osnowa dlq modelirowaniq posledowa...