Markov-Entscheidungsprozess-Modelle (MDP) werden in vielen Forschungsbereichen zur Modellierung von Entscheidungsproblemen verwendet. MDPs können durch Modellierung und Simulation (M&S) unter Verwendung des Discrete Event System Specification Formalismus (DEVS) aufgrund seiner modularen und hierarchischen Aspekte, die die Erklärbarkeit der Modelle verbessern, leicht entworfen werden. Insbesondere ist die Trennung zwischen dem Agenten und den Komponenten der Umgebung, die in den traditionellen Algorithmus des Reinforcement Learning (RL), wie z.B. Q-Learning, involviert sind, klar formalisiert, um die Beobachtbarkeit zu verbessern und die Integration von KI-Komponenten in den Entscheidungsprozess vorzusehen. Das Hauptaugenmerk dieser Arbeit liegt auf der Möglichkeit, ein markovianisches System mit einem Modellierungs- und Simulationsformalismus zu entwerfen, um einen Entscheidungsprozess mit größerer Erklärbarkeit durch Simulation zu optimieren. Darüber hinaus umfasst die Arbeit eine Untersuchung auf der Grundlage des Finanzprozessmanagements, dessen Spezifikation als MDP-basiertes RL-System und dessen M&S mit dem DEVS-Formalismus.