Un jeu de stratégie en temps réel (STR) est un jeu d'opposition dans lequel les participants positionnent et manoeuvrent des unités et des structures sous leur contrôle pour sécuriser des zones de la carte et/ou gagner en détruisant les unités et les structures de leurs adversaires. Il est possible de former de nouvelles unités et de construire de nouvelles structures au cours d'une partie avec une quantité limitée de ressources présentes sur la carte. Contrairement aux jeux comparables de confrontation au tour par tour, tels que les échecs et le go, les adversaires n'attendent pas les mouvements de leurs adversaires, de sorte que le jeu progresse naturellement, les unités interagissant entre elles en temps réel. En raison de la nature en temps réel du jeu, la complexité du jeu augmente de façon spectaculaire. Ces dernières années, la communauté de l'intelligence artificielle s'est intéressée de plus en plus aux jeux RTS, notamment du point de vue de l'apprentissage par renforcement, afin de créer un agent capable de jouer au jeu RTS, en raison du vaste espace état-action du problème. La modélisation et l'implémentation d'un agent d'apprentissage efficace capable de faire face à ce grand espace d'état est une tâche difficile.