Continuity of optimal values and solutions for control of Markhov chains with constraints
Continuité de la valeur optimale et solutions pour une chaîne de Markov contrôlée avec contraintes
Résumé
Lors de la résolution pratique de problèmes de contrôle et de jeux dynamiques, la difficulté provient, non seulement du fait que l'espace d'état est continu, mais aussi souvent du fait qu'il est infini. La discrétisation de l'espace doit donc s'accompagner d'une troncature. Ceci conduit à construire une suite d'approximations ; il s'agit de prouver que les solutions de ces problèmes approchés convergent bien vers la solution du problème initial. Plusieurs résultats dans cette direction ont été obtenus. Outre l'approximation de la fonction "valeur", l'article concerne l'approximation des stratégies elles-mêmes. Certains aspects de robustesse des stratégies optimales sont ainsi étudiés. Dans l'optique mentionnée ci-avant, l'approximation des problèmes de contrôle avec contraintes appliquées aux processus de décision markoviens est abordée.