文章目录
- 前言
- Introduction
- QMIX Operator
-
- 这个算子的属性(没看懂怎么算的)
- weighted QMIX 算子
-
- weightings
- Weighted QMIX Operators
- Deep RL 算法
前言
认识到自己确实没有很多MARL的经验,最近就进行了代码实践,不然看论文想idea总是空中楼阁,而且就算有好的想法,没有对比的算法也不行,所以还是要有自己的算法库,这样不论做项目还是做实验都会方便。最近照着师兄的代码实现了一遍QMIX,值分解的套路算是明白了。代码经验真的得靠实践,实践才会知道paper之外的各种问题。而且算法效率很重要,可以帮忙缩短一半时间。但是不要陷入代码改进的泥潭,比如为了更好的可视化搞半天,或者是项目结构调来调去,纠结哪些封装哪些不封装。这是无底洞,我的目标还是实现更多的SOTA,正好QMIX出后续了,研究研究,实现一波。
我的实现可以在