Dynamic stochastic dominance in bandit decision problems
[Dominance stochastique dynamique dans les problèmes de décision du bandit]
Résumé
Dans l'analyse dynamique de la décision, il est important de déterminer comment un agent sélectionne une possibilité parmi de nombreuses alternatives incertaines exclusives discrètes. Les processus de décision du bandit offrent un cadre dynamique simple mais riche. Le but de cette étude est d'analyser les propriétés de monotonicité des décisions optimales dans ces problèmes, en ce qui concerne la distribution de probabilité des processus de gain. Les classements sur l'ensemble des processus de gain sont fournis par l'extension de la notion de dominance stochastique à ces processus stochastiques. Des exemples économiques des propriétés de monotonicité sont donnés.