Note :
Ce livre est largement considéré comme une ressource essentielle pour les enthousiastes et les professionnels de l'apprentissage par renforcement (RL). Il est loué pour sa profondeur, sa clarté, ses exercices bien structurés et son approche pédagogique, qui le rendent accessible même à ceux qui ont un bagage mathématique modéré. Cependant, les critiques se concentrent sur la qualité d'impression inégale, en particulier dans les éditions qui ne proviennent pas directement de MIT Press, et sur les inquiétudes quant à sa pertinence pour les débutants complets dans le domaine.
Avantages:⬤ Couverture complète de l'apprentissage par renforcement
⬤ exercices bien structurés et rigoureux
⬤ explications claires
⬤ bonne qualité d'impression dans les copies vendues directement par MIT Press
⬤ utile pour différents niveaux d'expertise (en particulier pour ceux qui ont des connaissances préalables)
⬤ inclut des connexions interdisciplinaires avec la psychologie et les neurosciences.
⬤ Qualité d'impression irrégulière, en particulier chez les vendeurs tiers
⬤ ne convient pas comme texte d'introduction pour les débutants complets
⬤ certaines sections sont mathématiquement intensives
⬤ le contenu historique peut être jugé inutile par certains lecteurs
⬤ des erreurs éditoriales mineures ont été signalées dans certains exemplaires.
(basé sur 115 avis de lecteurs)
Reinforcement Learning, Second Edition: An Introduction
La nouvelle édition, considérablement augmentée et mise à jour, d'un texte largement utilisé sur l'apprentissage par renforcement, l'un des domaines de recherche les plus actifs de l'intelligence artificielle.
L'apprentissage par renforcement, l'un des domaines de recherche les plus actifs en intelligence artificielle, est une approche informatique de l'apprentissage par laquelle un agent tente de maximiser le montant total de la récompense qu'il reçoit tout en interagissant avec un environnement complexe et incertain. Dans Reinforcement Learning, Richard Sutton et Andrew Barto présentent de manière claire et simple les idées et algorithmes clés de ce domaine. Cette deuxième édition a été considérablement élargie et mise à jour, présentant de nouveaux sujets et actualisant la couverture d'autres sujets.
Comme la première édition, cette deuxième édition se concentre sur les algorithmes de base de l'apprentissage en ligne, le matériel plus mathématique étant présenté dans des encadrés ombrés. La partie I couvre autant que possible l'apprentissage par renforcement sans aller au-delà du cas tabulaire pour lequel des solutions exactes peuvent être trouvées. De nombreux algorithmes présentés dans cette partie sont nouveaux dans la deuxième édition, notamment UCB, Expected Sarsa et Double Learning. La partie II étend ces idées à l'approximation des fonctions, avec de nouvelles sections sur des sujets tels que les réseaux neuronaux artificiels et la base de Fourier, et offre un traitement élargi de l'apprentissage hors politique et des méthodes de gradient de politique. La troisième partie comporte de nouveaux chapitres sur les relations entre l'apprentissage par renforcement et la psychologie et les neurosciences, ainsi qu'un chapitre actualisé sur les études de cas, notamment AlphaGo et AlphaGo Zero, le jeu Atari et la stratégie de pari d'IBM Watson. Le dernier chapitre traite des futurs impacts sociétaux de l'apprentissage par renforcement.
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)