Справка
x
Поиск
Закладки
Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.
Мультиагентное обучение с подкреплением
Глава 2. Обучение в матричных и стохастических играх
Предыдущая страница
Следующая страница
Table of contents
Предисловие
Введение
Глава 1. Независимое табличное обучение
+
Глава 2. Обучение в матричных и стохастических играх
-
2.1. Классификация
2.2. Модель
2.2.1. Матричные игры
2.2.2. Стохастические игры
2.3. Алгоритм
2.3.1. Поиск экстремума стратегий (PHC)
2.3.2. "Выигрывай или учись быстро" (WoLF-PHC)
2.3.3. Q-обучение Нэша (Nash-Q)
2.4. Карта
2.5. Технология
2.6. Код
2.6.1. Алгоритм WoLF-PHC
2.6.2. Алгоритм Nash-Q
2.7. Эксперимент
2.7.1. Матричные игры
2.7.2. Стохастические игры
2.8. Выводы
2.9. Задачи для самоконтроля
Глава 3. Нейросетевое обучение
+
Глава 4. Эволюционное обучение
+
Глава 5. Роевое обучение
+
Заключение
Литература
+
Данный блок поддерживает скрол*