Des bandits à la recherche arborescente de Monte-Carlo : Débloquer l'optimisation et la planification

Des bandits à la recherche arborescente de Monte-Carlo : Le principe d'optimisme appliqué à l'optimisation et à la planification (Remi Munos)

Titre original :

From Bandits to Monte-Carlo Tree Search: The Optimistic Principle Applied to Optimization and Planning

Contenu du livre :

Des bandits à la recherche arborescente de Monte-Carlo : Le principe d'optimisme appliqué à l'optimisation et à la planification couvre plusieurs aspects du principe de "l'optimisme face à l'incertitude" pour les problèmes d'optimisation à grande échelle avec un budget numérique fini. La motivation initiale de la monographie est venue du succès empirique de la méthode dite de "Monte-Carlo Tree Search" popularisée dans le jeu de Go sur ordinateur et étendue à de nombreux autres jeux ainsi qu'à des problèmes d'optimisation et de planification.

Elle pose les fondements théoriques du domaine en caractérisant la complexité des problèmes d'optimisation et en concevant des algorithmes efficaces avec des garanties de performance. La principale orientation suivie dans cette monographie consiste à décomposer un problème complexe de prise de décision (tel qu'un problème d'optimisation dans un grand espace de recherche) en une séquence de décisions élémentaires, où chaque décision de la séquence est résolue à l'aide d'un "bandit à plusieurs bras" stochastique (modèle mathématique pour la prise de décision dans des environnements stochastiques). Cela définit une recherche hiérarchique qui possède la caractéristique intéressante de commencer l'exploration par un échantillonnage quasi-uniforme de l'espace et de se concentrer ensuite, à différentes échelles, sur les zones les plus prometteuses (en utilisant le principe d'optimisme) jusqu'à finalement effectuer une recherche locale autour des optima globaux de la fonction.

Cette monographie considère le problème de l'optimisation des fonctions dans les espaces de recherche généraux (tels que les espaces métriques, les espaces structurés, les arbres et les graphes) ainsi que le problème de la planification dans les processus de décision de Markov. Sa principale contribution est une classe d'algorithmes optimistes hiérarchiques avec différentes instanciations algorithmiques selon que les évaluations sont bruyantes ou non et qu'une certaine mesure de la ''douceur'' locale de la fonction autour du maximum global est connue ou inconnue.

Autres informations sur le livre :

ISBN :	9781601987662
Auteur :	Remi Munos
Éditeur :	New Publ Inc
Langue :	anglais
Reliure :	Broché

Achat:

Actuellement disponible, en stock.

Des bandits à la recherche arborescente de Monte-Carlo : Le principe d'optimisme appliqué à l'optimisation et à la planification

Titre original :

Contenu du livre :

Autres informations sur le livre :

Achat:

Autres livres de l'auteur :

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :