Accéder directement au contenu Accéder directement à la navigation
Ouvrage

Continuity of optimal values and solutions for control of Markov chains with constraints

Résumé : Lors de la résolution pratique de jeux dynamiques, la difficulté provient non seulement du fait que l'espace d'état est continu, mais souvent aussi du fait qu'il est infini. La discrétisation de l'espace doit donc s'accompagner d'une troncature. Ceci conduit à construire une suite d'approximations, et il s'agit de prouver que les solutions des problèmes approchés convergent bien vers la solution du problème initial. Plusieurs résultats dans cette direction ont été obtenus. Outre l'approximation de la fonction Valeur, ces travaux concernent un aspect plus nouveau : l'approximation des stratégies elles-mêmes. Les auteurs ont ainsi étudié certains aspects de robustesse des stratégies optimales et développé une théorie générale pour problèmes de contrôle avec contraintes qu'ils ont appliquée aux processus de décision Markoviens.
Type de document :
Ouvrage
Liste complète des métadonnées

https://hal.inrae.fr/hal-02837891
Déposant : Migration Prodinra <>
Soumis le : dimanche 7 juin 2020 - 12:12:29
Dernière modification le : jeudi 2 juillet 2020 - 17:20:05

Identifiants

  • HAL Id : hal-02837891, version 1
  • PRODINRA : 151592

Collections

Citation

Mabel Tidball, A. Lombardi, O. Pourtallier, E. Altman. Continuity of optimal values and solutions for control of Markov chains with constraints. 19 p., 1999. ⟨hal-02837891⟩

Partager

Métriques

Consultations de la notice

6