Поиск

Закладки

Озвучивание недоступно

Озвучить книгу

Изменить режим чтения

Изменить размер шрифта

Оглавление

Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.

Мультиагентное обучение с подкреплением

Глава 3. Нейросетевое обучение

Для продолжения работы требуется Registration

Предыдущая страница

Следующая страница

Table of contents

Предисловие

Введение

Глава 1. Независимое табличное обучение +

Глава 2. Обучение в матричных и стохастических играх +

Глава 3. Нейросетевое обучение -

3.1. Классификация

3.2. Модель

3.2.1. Глубокое Q-обучение

3.2.2. Децентрализованные частично наблюдаемые марковские процессы принятия решений (Dec-POMDP)

3.2.3. Двойная декомпозиция Q-значений

3.2.4. Глубокий детерминированный градиент стратегий

3.3. Алгоритмы

3.3.1. Независимое глубокое обучение с использованием полносвязной нейронной сети (IQN)

3.3.2. Централизованное обучение с использованием сверточной нейронной сети (CDQN)

3.3.3. Декомпозиция Q-значений c использованием рекуррентной нейронной сети (VDN)

3.3.4. Мультиагентный глубокий детерминированный градиент стратегий (MADDPG)

3.4. Карта

3.5. Технология

3.6.1. Алгоритм IQN

3.6.2. Алгоритм VDN

3.6.3. Алгоритм MADDPG

3.7. Эксперимент

3.7.1. Алгоритм IQN

3.7.2. Алгоритм CDQN

3.7.3. Алгоритм VDN

3.7.4. Алгоритм MADDPG

3.8. Выводы

3.9. Задачи для самоконтроля

Глава 4. Эволюционное обучение +

Глава 5. Роевое обучение +

Заключение

Литература +

Данный блок поддерживает скрол*