Поиск

Закладки

Озвучивание недоступно

Озвучить книгу

Изменить режим чтения

Изменить размер шрифта

Оглавление

Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.

Обучение с подкреплением на PyTorch: сборник рецептов

Глава 2. Марковские процессы принятия решений и динамическое программирование

Для продолжения работы требуется Registration

Предыдущая страница

Следующая страница

Table of contents

Об авторе

О рецензентах

Предисловие

Глава 1. Приступаем к обучению с подкреплением и PyTorch

Глава 2. Марковские процессы принятия решений и динамическое программирование

Глава 3. Применение методов Монте-Карло для численного оценивания

Глава 4. TD-обучение и Q-обучение

Глава 5. Решение задачи о многоруком бандите

Глава 6. Масштабирование с помощью аппроксимации функций

Глава 7. Глубокие Q-сети в действии

Глава 8. Реализация методов градиента стратегии и оптимизация стратегии

Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird

Предметный указатель

Данный блок поддерживает скрол*