Apprentissage par renforcement sensible au risque via la recherche de gradient de politique

Apprentissage par renforcement sensible au risque via la recherche de gradient de politique (Prashanth L. a.)

Titre original :

Risk-Sensitive Reinforcement Learning via Policy Gradient Search

Contenu du livre :

L'apprentissage par renforcement (AR) est l'un des piliers fondamentaux de l'intelligence artificielle et de l'apprentissage automatique. La notion de risque est une considération importante dans tout problème d'optimisation ou de contrôle, mais son intégration dans l'apprentissage par renforcement est relativement récente. Cette monographie passe en revue la recherche sur la résolution de problèmes sensible au risque qui utilise la recherche de gradient de politique.

Les auteurs passent en revue certains des travaux récents dans ce domaine, en particulier lorsque la recherche de gradient de politique est l'approche de la solution. Dans le premier cadre de RL sensible au risque, ils couvrent les mesures de risque populaires basées sur la variance, la valeur conditionnelle à risque et les contraintes de chance, et présentent un modèle pour les algorithmes de RL sensible au risque basés sur le gradient de politique en utilisant une formulation lagrangienne. Dans le cas où le risque est incorporé directement dans la fonction objective, ils considèrent une formulation d'utilité exponentielle, la théorie des perspectives cumulatives et des mesures de risque cohérentes.

S'adressant aussi bien aux novices qu'aux experts, les auteurs ont fait en sorte que le texte soit entièrement autonome, mais aussi organisé de manière à permettre aux lecteurs experts de sauter les chapitres de fond. Il s'agit d'un guide complet pour les étudiants et les chercheurs travaillant sur cet aspect de l'apprentissage automatique.

Autres informations sur le livre :

ISBN :9781638280262
Auteur :
Éditeur :
Langue :anglais
Reliure :Broché
Nombre de pages :170

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

Apprentissage par renforcement sensible au risque via la recherche de gradient de politique -...
L'apprentissage par renforcement (AR) est l'un des...
Apprentissage par renforcement sensible au risque via la recherche de gradient de politique - Risk-Sensitive Reinforcement Learning via Policy Gradient Search

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)