Markowskie modeli processow prinqtiq reshenij (MDP) shiroko ispol'zuütsq dlq modelirowaniq problem prinqtiq reshenij wo mnogih oblastqh issledowanij. MDP mogut byt' legko razrabotany s pomosch'ü modelirowaniq i simulqcii (M&S) s ispol'zowaniem formalizma specifikacii diskretno-sobytijnyh sistem (DEVS) blagodarq ego modul'nym i ierarhicheskim aspektam, kotorye uluchshaüt ob#qsnimost' modelej. V chastnosti, razdelenie mezhdu agentom i komponentami sredy, uchastwuüschimi w tradicionnom algoritme obucheniq s podkrepleniem (RL), takom kak Q-Learning, chetko formalizowano dlq powysheniq nablüdaemosti i obespecheniq integracii komponentow II w process prinqtiq reshenij. Osnownaq cel' dannoj raboty - predostawit' wozmozhnost' proektirowaniq markowskoj sistemy s pomosch'ü formalizma modelirowaniq i imitacii dlq optimizacii processa prinqtiq reshenij s bol'shej ob#qsnimost'ü posredstwom imitacii. Krome togo, rabota wklüchaet w sebq issledowanie, osnowannoe na uprawlenii finansowymi processami, ego specifikaciü w wide RL-sistemy na osnowe MDP i ego M&S s formalizmom DEVS.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.