近日,北京大学与伦敦国王学院合作完成的论文《大规模多智能体系统的高效强化学习》在国际学术期刊《自然·机器智能》上发表,该研究实现了高效去中心化协同决策,有望提升人工智能决策算法的扩展性和适用性。
论文指出,多智能体系统以大量智能体交互数据为基础,利用大量计算资源推动每个智能体学习如何与其他智能体合作执行复杂任务,核心在于多智能体强化学习。研究团队在较为复杂的城市交通和电力网络中进行了测试,结果显示,去中心化方法能将信息交换成本降低70%以上,并且随着智能体数量增长,这一比例还会继续下降。
论文通讯作者、北京大学人工智能研究院助理教授杨耀东介绍说,研究团队通过网络化结构解耦系统的全局动态特性,使智能体能够独立学习局部状态转移、邻域信息价值和去中心化策略,从而将复杂的大规模决策问题转化为更易解决的问题。这一研究成果对于在大型电力网络、城市交通信号控制等大规模多智能体系统中扩展人工智能模型具有重要意义。
马成栋举例称,在大型电网系统中,节点信息交换频繁,去中心化可以降低故障节点对其他节点性能的严重影响,提高电网系统的稳定性和安全性。通过这一研究成果,人工智能决策算法在大规模多智能体系统中有望获得更广泛的应用。