Los modelos de Proceso de Decisión de Markov (MDP) se utilizan ampliamente para modelar problemas de toma de decisiones en muchos campos de investigación. Los MDP pueden diseñarse fácilmente mediante modelado y simulación (M&S) utilizando el formalismo de Especificación de Sistemas de Eventos Discretos (DEVS) debido a sus aspectos modulares y jerárquicos, que mejoran la explicabilidad de los modelos. En particular, la separación entre el agente y los componentes del entorno implicados en el algoritmo tradicional de aprendizaje por refuerzo (RL), como Q-Learning, está claramente formalizada para mejorar la observabilidad y prever la integración de componentes de IA en el proceso de toma de decisiones. El objetivo principal de este trabajo es ofrecer la posibilidad de diseñar un sistema markoviano con un formalismo de modelado y simulación para optimizar un proceso de toma de decisiones con una mayor explicabilidad a través de la simulación. Además, el trabajo involucra una investigación basada en la gestión de procesos financieros, su especificación como un sistema RL basado en MDP, y su M&S con el formalismo DEVS.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.