当前位置：代码迷 >> 综合 >> [NIPS2020] Weighted QMIX: Expanding Monotonic Value Function Factorisation 笔记

详细解决方案

[NIPS2020] Weighted QMIX: Expanding Monotonic Value Function Factorisation 笔记

热度：95 发布时间：2023-12-12 08:56:06.0

文章目录

前言
Introduction
QMIX Operator
- 这个算子的属性（没看懂怎么算的）
weighted QMIX 算子
- weightings
- Weighted QMIX Operators
Deep RL 算法

前言

认识到自己确实没有很多MARL的经验，最近就进行了代码实践，不然看论文想idea总是空中楼阁，而且就算有好的想法，没有对比的算法也不行，所以还是要有自己的算法库，这样不论做项目还是做实验都会方便。最近照着师兄的代码实现了一遍QMIX，值分解的套路算是明白了。代码经验真的得靠实践，实践才会知道paper之外的各种问题。而且算法效率很重要，可以帮忙缩短一半时间。但是不要陷入代码改进的泥潭，比如为了更好的可视化搞半天，或者是项目结构调来调去，纠结哪些封装哪些不封装。这是无底洞，我的目标还是实现更多的SOTA，正好QMIX出后续了，研究研究，实现一波。

我的实现可以在

查看全文