基于合作博弈的多无人机任务研究

安防与国防   作者:姚晓明 时间:2016-06-28来源:电子产品世界

编者按:针对多无人机合作博弈问题,对多无人机任务策略进行研究。通过考虑合作联盟的目标价值指标函数和代价指标函数,建立多无人机合作联盟博弈模型,给出一种合作博弈的求解方法,最终得到多无人机最优联盟策略。仿真结果表明,该方法具有很好的可行性和有效性。

摘要:针对多无人机合作博弈问题,对多无人机任务策略进行研究。通过考虑合作联盟的目标价值指标函数和代价指标函数,建立多无人机合作联盟博弈模型,给出一种合作博弈的求解方法,最终得到多无人机最优联盟策略。仿真结果表明,该方法具有很好的可行性和有效性。

引言

  随着当今军事技术的发展与需求,将博弈论应用到军事领域中己受到国内外学者的广泛关注与研究[1-2]。文献[3]通过分析实际环境中信息的不确定性,提出了不确定信息情况下解决多无人机任务分配的问题。文献[4]提出一种分布式通信决策模型,利用卡尔曼滤波算法对无人机局部观测信息进行滤波处理,当局部任务分配结果与当前执行的跟踪任务产生冲突时,无人机发出通信信息,实现局部信息共享,从而达到信息的一致;在不确定条件的环境中,实时有效的动态任务分配是多无人机顺利完成对地攻击任务的关键点。文献[5]基于拍卖机制原理提出了多无人机的动态任务分配算法,同时也有文献[6]基于动态博弈理论提出了攻防双方目标武器分配方法。而以无人机攻防为背景,建立基于不完全信息的无人机攻防对抗动态博弈模型,利用免疫进化算法[7]求解出贝叶斯纳什均衡,得到了无人机的最优策略序列。文献[8]建立了基于Agent协商的多无人机任务分配模型,构建了无人机编队中资源管理和任务管理等两种Agent角色,并建立了两种角色之间任务分配协商协议,既有效地保证了个体Agent的自主性,又最大限度地发挥了多Agent之间的合作性。文献[9]针对异构多无人机协同任务分配问题,提出了一种基于改进的遗传算法的多UAV任务分配方法。

  需要指出的是,虽然国内外在多无人机作战博弈中已经取得了一些很有价值和意义的研究成果,但目前已有的博弈方法大部分的研究集中于非合作博弈问题,没有考虑到多无人机合作博弈问题。而在实际网络环境中,为了提高作战效能,尤其是进攻重要目标的时候,需要考虑多无人机如何进行联盟合作问题,以提高整体的作战效益[10]。因此,如何在实际作战中考虑我方多无人机合作博弈问题,求解合作博弈的纳什均衡值问题,这是一个新的重要研究课题。

  基于此,本文将多无人机合作联盟考虑为合作博弈问题,实现整体联盟收益最大化,提高多无人机整体执行任务的收益。在实际情况中,无人机之间的通信常会受到传输速度、网络拥塞等因素的影响而存在通信延迟。因此,本文将考虑存在通信延迟时,根据多无人机信息传输的过程,建立多无人机合作联盟博弈模型,给出合作博弈的求解方法,并动态分析联盟结构的变化情况。

1 无人机合作博弈模型的建立

1.1 合作联盟的基本概念

  无线通信网络中,联盟中的无人机集合表示为N={1,2,...,n},对任意,称S为N的一个联盟。为联盟集合,其中联盟集合元素的个数为2n,特殊情况,允许取,后一种情况称为一个大联盟。对于无人机系统,自主无人机之间能以通信的方式传递状态信息,侦察无人机检测到关于任务的信息后,选择传递信息至周围的无人机,形成联盟,共同完成特定的任务。具体的多无人机合作联盟模型如图1所示。

1.2 合作联盟作战收益函数

  收益是指无人机在合作联盟中最终所得或损失。考虑合作联盟收益指标为目标价值和代价指标,建立多无人机合作联盟的作战收益函数。

  1)目标价值指标函数

  在多无人机作战过程中,目标价值是首先考虑的一个重要指标。重点考虑侦察无人机的目标价值,定义如下:

(1)

  其中,di(s)为侦查无人机的数据包传送延时,,为侦查无人机i单独行动时的数据包传送延时,为数据包的生存时间值,为联盟s中无人机的数目。

  2)代价指标函数

  代价指标是指侦查无人机给执行无人机的平均支付。侦查无人机i传送数据包到同-联盟中的执行无人机j的平均成本Ci(S),定义如下:

(2)

  其中,为侦察无人机i传送数据包到同-联盟中执行无人机j的平均成本,Pij为侦察无人机i与执行无人机j的相遇概率。

  3)联盟合作收益函数

  综合上述模型,可以得到侦察无人机i的收益函数Ui(S)

(3)

  其中,a、β分别为目标价值和代价的非负权重系数。

2 无人机合作联盟求解

  在这里,我们首先介绍联盟形成算法:

  联盟形成算法通过比较联盟内无人机的收益,根据Merge-Split-Rule形成联盟。若无人机形成联盟后收益提高,则自组织形成联盟;反之无人机不参与联盟形成。Merge-Split-Rule定义如下[11]

  Merge Rule-联盟集合,当无人机收益满足时,小联盟合并为大联盟,即:

(4)

  Split Rule-大联盟,当无人机收益满足时,大联盟分裂为若干不相交小联盟,即:

(5)

  无人机的通信距离为do,执行无人机在侦察无人机的通信范围内,称侦察无人机遇见执行无人机,任务在侦察无人机的通信范围内,称侦察无人机发现任务。侦察无人机与执行无人机形成联盟来完成任务。

  假设仿真区域为2km×2km,任务均匀分布在区域内,水平间距和垂直间距均为400m,有4架无人机,其中第1架侦察任务,另3架执行任务,侦察无人机具有传感器,执行无人机具有相同的火力能力,以相同的10km高度和最大50km/h速度飞行。设定无人机的通信距离分别为50m、100m和200m,得出三种情况下侦察无人机发现任务和侦察无人机与执行无人机的相遇概率,如表1所示。

  4架无人机,其中,无人机1为侦察无人机,无人机2、3和4为执行无人机,那么在网络中可能存在7种联盟结构:{1,2},{1,3},{1,4},{1,2,3},{1,2,4},{1,3,4},{1,2,3,4}。依据Merge-Split-Rule算法,无人机之间形成合作的联盟。根据以上概率,分别计算在各种联盟结构下的收益,如表2所示。从中可以看到,大联盟结构收益最大,即在这种情况下,所有的无人机选择形成{1,2,3,4}这种结构来共同完成任务并且在这种结构下获得的收益最大。

3 系统性能分析

  当变化侦察无人机传送数据包到同-联盟中执行无人机的平均成本系数为时,联盟结构进行动态调整,如图2所示。当代价在0~9范围内时,大联盟结构一直是最佳联盟结构,当超过9时,形成{1,3,4}这种结构较好,也就是说,无人机综合考虑合作的成本及获得收益,会形成这种联盟结构。

4 总结

  本文通过联盟形成算法,分析多无人机执行任务,考虑侦察无人机传递信息到执行无人机的代价,以及无人机执行任务的通信延时,建立多无人机合作博弈模型,得出最佳联盟结构,获得最小通信延时,并在代价变化的情况下分析了系统性能。

参考文献:

  [1]Poropudas J, Virtanen K. Game-theoretic validation and analysis of air combat simulation models[J]. Systems, Man and Cybernetics, Part A: Systems and Humans, IEEE Transactions on, 2010, 40(5): 1057-1070.

  [2]McGrew J S, How J P, Williams B, et al. Air-combat strategy using approximate dynamic programming[J]. Journal of guidance, control, and dynamics, 2010, 33(5): 1641-1654.

  [3]陈侠, 唐婷. 不确定环境下多无人机动态任务分配方法[J]. 火力与指挥控制, 2013, 38(1): 45-49.

  [4]崔亚妮, 任佳, 杜文才. 多目标跟踪下的无人机分布式通信决策模型[J]. 计算机仿真, 2014, 31(7): 68-72.

  [5]周小程, 严建钢, 谢宇鹏, 等. 多无人机对地攻击任务分配算法[J]. 海军航空工程学院学报, 2012, 27(3): 308-312.

  [6]马飞,曹泽阳,刘晖.基于纳什均衡的动态目标分配策略研究[J].现代防御技术,2010,38(6):81-84.

  [7]惠一楠, 朱华勇, 沈林成. 无人机攻防对抗不完全信息动态博弈方法研究[J]. 兵工自动化, 2009, 28(1): 4-7.

  [8]罗贺, 王国强, 胡笑旋, 等. 基于 Agent 的多无人机任务分配模型[J]. 火力与指挥控制, 2014, 39(7): 22-26.

  [9]王婷, 符小卫, 高晓光. 基于改进遗传算法的异构多无人机任务分配[J]. 火力与指挥控制, 2013, 38(5): 37-41.

  [10]Virtanen K, Karelahti J, Raivio T. Modeling air combat by a moving horizon influence diagram game[J]. Journal of guidance, control, and dynamics, 2006, 29(5): 1080-1091.

  [11]Zhang R, Song L, Han Z, et al. Distributed resource allocation for device-to-device communications underlaying cellular networks[C]//Communications (ICC), 2013 IEEE International Conference on. IEEE, 2013: 1889-1893.

本文来源于中国科技期刊《电子产品世界》2016年第6期第46页,欢迎您写论文时引用,并注明出处。

关键词: 合作博弈 无人机 通信延时 联盟形成算法 201607

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章


用户评论

请文明上网,做现代文明人
验证码:
查看电脑版