北邮人论坛的十大热门帖子的汇总文章 北邮人论坛十大_2024_04_09,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2024_04_08
北邮人论坛的十大热门帖子的汇总文章 北邮人论坛十大_2024_04_08,使用手机端打开不需要登录,使用电脑端打开需要登录。
【多智能体强化学习】MAPPO 论文笔记
本文会对多智能体强化学习算法 MAPPO 进行介绍,包含主要想法(其实主要想法和 MADDPG 很类似),和一些训练的建议。
北邮人论坛十大_2024_04_07
北邮人论坛的十大热门帖子的汇总文章 北邮人论坛十大_2024_04_07,使用手机端打开不需要登录,使用电脑端打开需要登录。
【多智能体强化学习】MADDPG 论文笔记
本文会介绍多智能体强化学习中的 MADDPG 算法,这是一个集中训练、分布式执行的框架,基于 actor-critic 的框架,这里每个 agent 会有一个 actor 和 cr...
北邮人论坛十大_2024_04_06
北邮人论坛的十大热门帖子的汇总文章 北邮人论坛十大_2024_04_06,使用手机端打开不需要登录,使用电脑端打开需要登录。
【多智能体强化学习】QMIX 论文笔记
本文是对多智能体强化学习中值分解方法 QMIX 的介绍。会介绍 QMIX 算法基本思想,以及进行代码解读。
北邮人论坛十大_2024_04_05
北邮人论坛的十大热门帖子的汇总文章 北邮人论坛十大_2024_04_05,使用手机端打开不需要登录,使用电脑端打开需要登录。
【多智能体强化学习】VDN 论文笔记
本文会介绍多智能体强化学习中的Value Decomposition Networks(VDN),包括(1)主要思想,(2)核心框架,(3)VDN 的代码实现。
北邮人论坛十大_2024_04_04
北邮人论坛的十大热门帖子的汇总文章 北邮人论坛十大_2024_04_04,使用手机端打开不需要登录,使用电脑端打开需要登录。
309