Note :

Il n'y a actuellement aucun avis de lecteur. La note est basée sur 3 votes.
Deep Reinforcement Learning in Unity: With Unity ML Toolkit
Chapitre 1 : Introduction à l'apprentissage par renforcement.
Sous-thèmes.
1. Modèles de Markov et apprentissage basé sur l'état.
2. Équations de Bellman.
3. Création d'une simulation RL de Bandit Multi Armé.
4. Itération de la valeur et de la politique.
Chapitre 2 : Pathfinding et navigation.
Sous-sujets.
1. Pathfinding dans Unity.
2. Les maillages de navigation.
3. Création de l'IA ennemie.
Chapitre 3 : Configuration du SDK ML Agents Toolkit.
Sous - Sujets :
1. Installation des ML Agents.
2. Configuration de Brain Academy.
3. Liaison des agents ML avec Tensorflow à l'aide des carnets Jupyter.
4. Jouer avec des échantillons d'agents ML.
Chapitre 4 : Comprendre les agents et l'académie de Brain.
Sous-sujets :
1. Comprendre l'architecture de Brain.
2. Entraîner différents agents avec un seul cerveau.
3. Hyperparamètres génériques.
Chapitre 5 : Apprentissage par renforcement profond.
Sous-sujets :
1. Fondamentaux de l'apprentissage automatique mathématique avec Python.
2. Apprentissage profond avec Keras et Tensorflow.
3. Algorithmes d'apprentissage par renforcement profond.
4. Écriture d'un réseau neuronal pour l'apprentissage profond pour Brain.
5. Réglage des hyperparamètres pour l'optimisation.
6. Conception d'un réseau LSTM basé sur la mémoire avec Keras pour Brain.
7. Construction d'un agent d'IA pour le jeu de karting à l'aide d'un réseau entraîné.
Chapitre 6 : Réseaux compétitifs pour les agents d'intelligence artificielle.
Sous - Sujets :
1. Réseau coopératif et réseau antagoniste.
2. Apprentissage par renforcement étendu - Gradients de politique profonds.
3. Simulations réalisées avec les agents Unity ML.
4. Simulation d'un agent autonome d'IA pour la conduite autonome.
Chapitre 7 : Etude de cas - Obstacle Tower Challenge.
Sous - Sujets :
1. Défi de la tour d'obstacles.
2. Défi des agents Unity ML.
3. Développements de la recherche d'Unity AI.
4. Jouer avec l'enveloppe Open AI Gym.