Справка
x
Поиск
Закладки
Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.
Обучение с подкреплением на PyTorch: сборник рецептов
Глава 2. Марковские процессы принятия решений и динамическое программирование
Предыдущая страница
Следующая страница
Table of contents
Об авторе
О рецензентах
Предисловие
Глава 1. Приступаем к обучению с подкреплением и PyTorch
Глава 2. Марковские процессы принятия решений и динамическое программирование
Глава 3. Применение методов Монте-Карло для численного оценивания
Глава 4. TD-обучение и Q-обучение
Глава 5. Решение задачи о многоруком бандите
Глава 6. Масштабирование с помощью аппроксимации функций
Глава 7. Глубокие Q-сети в действии
Глава 8. Реализация методов градиента стратегии и оптимизация стратегии
Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird
Предметный указатель
Данный блок поддерживает скрол*