Справка
x
Поиск
Закладки
Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.
Мультиагентное обучение с подкреплением
Глава 3. Нейросетевое обучение
Поставить закладку
3.1. Классификация
Если Вы наш подписчик,то для того чтобы скопировать текст этой страницы в свой конспект,
используйте
просмотр в виде pdf
. Вам доступно 14 стр. из этой главы.
Для продолжения работы требуется
Registration
Предыдущая страница
Следующая страница
Table of contents
Предисловие
Введение
Глава 1. Независимое табличное обучение
+
Глава 2. Обучение в матричных и стохастических играх
+
Глава 3. Нейросетевое обучение
-
3.1. Классификация
3.2. Модель
3.2.1. Глубокое Q-обучение
3.2.2. Децентрализованные частично наблюдаемые марковские процессы принятия решений (Dec-POMDP)
3.2.3. Двойная декомпозиция Q-значений
3.2.4. Глубокий детерминированный градиент стратегий
3.3. Алгоритмы
3.3.1. Независимое глубокое обучение с использованием полносвязной нейронной сети (IQN)
3.3.2. Централизованное обучение с использованием сверточной нейронной сети (CDQN)
3.3.3. Декомпозиция Q-значений c использованием рекуррентной нейронной сети (VDN)
3.3.4. Мультиагентный глубокий детерминированный градиент стратегий (MADDPG)
3.4. Карта
3.5. Технология
3.6. Код
3.6.1. Алгоритм IQN
3.6.2. Алгоритм VDN
3.6.3. Алгоритм MADDPG
3.7. Эксперимент
3.7.1. Алгоритм IQN
3.7.2. Алгоритм CDQN
3.7.3. Алгоритм VDN
3.7.4. Алгоритм MADDPG
3.8. Выводы
3.9. Задачи для самоконтроля
Глава 4. Эволюционное обучение
+
Глава 5. Роевое обучение
+
Заключение
Литература
+
Данный блок поддерживает скрол*