万象城娱乐网站_万象城手机客户端【登录网址】

焦点新闻

自动化本科学生于《Neurocomputing》期刊发表文章

2020年07月08日 10时23分

   近日,万象城娱乐网站2016级本科生张洁夫在我院胡江平教授的指导下,于《Neurocomputing》期刊(JCR分区Q1期刊,影响因子:4.438)发表题为“Internal reinforcement adaptive dynamic programming for optimal containment control of unknown continuous-time multi-agent systems”的论文,张洁夫为第一作者,胡江平教授为通讯作者,万象城娱乐网站为第一作者单位。张洁夫自大二起加入胡江平教授团队,开展多智能体系统控制方面的研究,曾参与多项科研项目,并以第二作者身份在《Science China Information Science》期刊(JCR分区Q1期刊,影响因子:3.304)发表论文。目前,张洁夫已在美国密西根大学攻读机器人学硕士学位。


《Neurocomputing》为Elsevier旗下期刊,主要关注神经网络与学习系统在计算机、控制、优化、机器视觉等领域的理论与应用,为中科院分区计算机科学的学科顶级期刊。

  多智能体系统(MAS)以其在电力系统、传感器网络、移动机器人系统等领域的应用,近年来受到了学界的广泛关注,而其中的MAS最优包含控制问题则是关注的热点之一。传统的最优包含控制算法需要求解复杂的偏微分方程,且高度依赖系统模型,这些缺点都限制了其在现实中的应用。自适应动态规划(ADP)算法的出现在一定程度上解决了上述问题,但收敛速度慢等缺点仍使其在应用方面具有较大局限性。

  为了解决上述问题,在本文中,作者对传统ADP算法进行了改进,提出了含有内部增强信号的ADP(IR-ADP)算法。传统ADP算法仅依靠预先定义的外部增强信号来提供信息,对于较复杂的系统而言无法保证算法的收敛速度。相比之下,本文提出的IR-ADP算法新增了内部增强信号,这一信号包含更丰富的信息,能够加速算法的收敛。相关的数学分析证明,本文提出的算法能够在保证系统稳定性的同时令系统各项指标收敛至最优值。为了避免使用系统模型,实现数据驱动,作者使用了神经网络来分别近似内部增强信号、值函数和控制策略。仿真表明,这一算法对于不同通信拓扑结构的多智能体连续时间系统都能保证较好的控制效果,且收敛速度优于传统ADP算法。




上一条:我院仪器助力构建国内首个叶面积指数自动观测网络 下一条:我院党委2020年党建工作推进会暨七一座谈会圆满举行