Поиск

Закладки

Озвучить текст

Озвучить книгу

Изменить режим чтения

Изменить размер шрифта

Оглавление

Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.

Обучение с подкреплением на PyTorch: сборник рецептов

Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird

Поставить закладку

Если Вы наш подписчик,то для того чтобы скопировать текст этой страницы в свой конспект,
используйте просмотр в виде pdf. Вам доступно 2 стр. из этой главы.

Для продолжения работы требуется Регистрация

На предыдущую страницу

Предыдущая страница

Следующая страница

На следующую страницу

Оглавление

Об авторе

О рецензентах

Предисловие

Глава 1. Приступаем к обучению с подкреплением и PyTorch

Глава 2. Марковские процессы принятия решений и динамическое программирование

Глава 3. Применение методов Монте-Карло для численного оценивания

Глава 4. TD-обучение и Q-обучение

Глава 5. Решение задачи о многоруком бандите

Глава 6. Масштабирование с помощью аппроксимации функций

Глава 7. Глубокие Q-сети в действии

Глава 8. Реализация методов градиента стратегии и оптимизация стратегии

Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird

Предметный указатель

Данный блок поддерживает скрол*