Aprendizaje por refuerzo

Aprendizaje por refuerzo

Libro Nueva Generación

Versandkostenfrei!
Versandfertig in 1-2 Wochen
45,99 €
inkl. MwSt.
PAYBACK Punkte
23 °P sammeln!
Este libro está estructurado en cinco unidades, que ofrecen una experiencia de aprendizaje holística. El viaje comienza con una introducción a los algoritmos bandit, en la que se exploran conceptos básicos como los algoritmos Upper Confidence Bound (UCB) y Probably Approximately Correct (PAC). La siguiente unidad introduce el marco completo del aprendizaje por refuerzo (RL), que va más allá de los algoritmos bandit para considerar las interacciones agente-entorno en múltiples pasos temporales. Se introducen los Procesos de Decisión de Markov (MDP) como marco fundamental para modelar ta...