Apprentissage par renforcement et optimisation stochastique : Un cadre unifié pour les décisions séquentielles

Note :   (4,2 sur 5)

Apprentissage par renforcement et optimisation stochastique : Un cadre unifié pour les décisions séquentielles (B. Powell Warren)

Avis des lecteurs

Résumé:

Ce livre est un guide complet et approfondi de la programmation dynamique stochastique et de l'apprentissage par renforcement, adapté aux professionnels de la recherche opérationnelle. Il relie avec succès divers domaines, dont l'apprentissage par renforcement et la théorie du contrôle, tout en fournissant un cadre unifié pour la prise de décision séquentielle. Cependant, il souffre de nombreuses fautes de frappe et d'un style d'écriture que certains pourraient trouver alambiqué.

Avantages:

Une couverture complète des concepts de la prise de décision séquentielle.
Bien écrit et accessible aux lecteurs de différents horizons.
Fait le lien entre différents domaines de manière efficace, offrant des informations précieuses.
Fournit un cadre unifié pour de multiples communautés impliquées dans les décisions séquentielles.
Des exercices utiles et une bonne référence pour les professionnels.

Inconvénients:

Nombre élevé de fautes de frappe et choix de notation douteux.
Absence de dérivations pour certains résultats mathématiques, obligeant les lecteurs à les vérifier ou à les redévelopper par eux-mêmes.
Le style d'écriture peut être alambiqué pour certains, ce qui rend la lecture fastidieuse.
Le contenu est fortement axé sur la recherche opérationnelle, ce qui peut aliéner ceux qui viennent d'horizons différents, tels que l'apprentissage automatique.

(basé sur 12 avis de lecteurs)

Titre original :

Reinforcement Learning and Stochastic Optimization: A Unified Framework for Sequential Decisions

Contenu du livre :

APPRENTISSAGE PAR RENFORCEMENT ET OPTIMISATION STOCHASTIQUE DÉFRICHER LA JUNGLE DE L'OPTIMISATION STOCHASTIQUE.

Défricher la jungle de l'optimisation stochastique.

Les problèmes de décision séquentielle, qui consistent en "décision, information, décision, information", sont omniprésents et couvrent pratiquement toutes les activités humaines, qu'il s'agisse d'applications commerciales, de santé (santé personnelle et publique, et prise de décision médicale), d'énergie, de sciences, de tous les domaines de l'ingénierie, de la finance ou du commerce électronique. La diversité des applications a attiré l'attention d'au moins 15 domaines de recherche distincts, utilisant huit systèmes de notation distincts qui ont produit une vaste gamme d'outils analytiques. Il en résulte que des outils puissants développés par une communauté peuvent être inconnus d'autres communautés.

Reinforcement Learning and Stochastic Optimization offre un cadre canonique unique qui peut modéliser n'importe quel problème de décision séquentiel à l'aide de cinq composants essentiels : variables d'état, variables de décision, variables d'information exogènes, fonction de transition et fonction objective. Ce livre met en évidence douze types d'incertitude susceptibles d'entrer dans un modèle et rassemble les diverses méthodes de prise de décision, connues sous le nom de politiques, en quatre classes fondamentales qui couvrent toutes les méthodes suggérées dans la littérature académique ou utilisées dans la pratique.

Reinforcement Learning and Stochastic Optimization est le premier ouvrage à proposer un traitement équilibré des différentes méthodes de modélisation et de résolution des problèmes de décision séquentielle, en suivant le style utilisé par la plupart des ouvrages sur l'apprentissage automatique, l'optimisation et la simulation. La présentation est conçue pour les lecteurs ayant suivi un cours de probabilité et de statistique et s'intéressant à la modélisation et aux applications. La programmation linéaire est parfois utilisée pour des classes de problèmes spécifiques. Le livre s'adresse aux lecteurs qui découvrent le domaine, ainsi qu'à ceux qui ont une certaine expérience de l'optimisation en situation d'incertitude.

Tout au long de cet ouvrage, les lecteurs trouveront des références à plus de 100 applications différentes, couvrant les problèmes d'apprentissage pur, les problèmes d'allocation dynamique des ressources, les problèmes généraux dépendant de l'état et les problèmes hybrides d'apprentissage et d'allocation des ressources, tels que ceux qui sont apparus lors de la pandémie de COVID. Il y a 370 exercices, organisés en sept groupes, allant de questions de révision, modélisation, calcul, résolution de problèmes, théorie, exercices de programmation et un "problème de journal" que le lecteur choisit au début du livre, et qui est utilisé comme base pour les questions tout au long du reste du livre.

Autres informations sur le livre :

ISBN :9781119815037
Auteur :
Éditeur :
Reliure :Relié
Année de publication :2022
Nombre de pages :1136

Achat:

Actuellement disponible, en stock.

Je l'achète!

Autres livres de l'auteur :

Programme dynamique approximatif - Approximate Dynamic Programmin
Éloge de la première édition "Enfin, un livre consacré à la programmation dynamique et écrit dans...
Programme dynamique approximatif - Approximate Dynamic Programmin
Analyse et modélisation des décisions séquentielles : Modélisation avec Python - Sequential Decision...
Les problèmes de décisions séquentielles se posent...
Analyse et modélisation des décisions séquentielles : Modélisation avec Python - Sequential Decision Analytics and Modeling: Modeling with Python
Une approche moderne de l'enseignement d'une introduction à l'optimisation - A Modern Approach to...
L'optimisation devrait être la science qui...
Une approche moderne de l'enseignement d'une introduction à l'optimisation - A Modern Approach to Teaching an Introduction to Optimization
Apprentissage par renforcement et optimisation stochastique : Un cadre unifié pour les décisions...
APPRENTISSAGE PAR RENFORCEMENT ET OPTIMISATION...
Apprentissage par renforcement et optimisation stochastique : Un cadre unifié pour les décisions séquentielles - Reinforcement Learning and Stochastic Optimization: A Unified Framework for Sequential Decisions

Les œuvres de l'auteur ont été publiées par les éditeurs suivants :

© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)