当前位置: 代码迷 >> 综合 >> Learning Transferable Cooperative Behavior in Multi-Agent Teams 笔记
  详细解决方案

Learning Transferable Cooperative Behavior in Multi-Agent Teams 笔记

热度:33   发布时间:2023-12-12 09:01:13.0

文章目录

  • 前言
  • 背景
  • Method
    • Agent-Entity Graph
    • Learning to communicate
    • 课程训练
  • 实验
    • Zero shot Generalization

前言

最近实在是没怎么看论文,这篇论文的方法也算是比较新,方向我觉得是未来比较火的一个,趁现在看看能不能做点工作。毕竟图网络比较火,跟它结合也能做点东西。
尽管mutil-agent interactions可以被很自然的建模为一个图,但环境通常都被当做一个黑盒。本文创建一个共享的agent-entity图,agent和环境实体构成顶点,边存在于互相通信的顶点之间。这个框架与系统中出现的agent和entity的数量无关,与排列无关。用于解决完全协作问题。第一个使用分布式框架解决多智能体迁移和协作行为的课程学习问题。

背景

协作多智能体系统在多种多样的领域都有应用,比如电信、资源管理、机器人学等,然而这种系统的复杂性使得设计启发性的行为策略非常难。尽管MARL使得智能体可以学习最大化某个团队值函数的协作行为,但它也存在很多显著的挑战?

  相关解决方案