基于贝叶斯博弈的无人机通信延时研究-电子产品世界手机版

基于贝叶斯博弈的无人机通信延时研究

安防与国防作者：余益科时间：2016-09-28来源：电子产品世界

编者按：在无人机通信网络中，无人机之间协同通信已经成为重要的研究方向。本文针对无人机类型的不确定性，基于动态贝叶斯联盟博弈，通过计算无人机在最小通信延迟下的收益，利用贝叶斯联盟博弈来分析无人机的策略选择。此外，利用信念更新机制来发现系统中潜在的联盟成员。仿真表明，获得的联盟结构是纳什稳定的。

摘要：在无人机通信网络中，无人机之间协同通信已经成为重要的研究方向。本文针对无人机类型的不确定性，基于动态贝叶斯联盟博弈，通过计算无人机在最小通信延迟下的收益，利用贝叶斯联盟博弈来分析无人机的策略选择。此外，利用信念更新机制来发现系统中潜在的联盟成员。仿真表明，获得的联盟结构是纳什稳定的。

引言

　　多无人机(unmanned aerial vehicle，UAV)协同搜索是多无人机协同的一个重要研究方向。多架UAV同时对一个未知区域进行搜索，目的就是大量获取搜索区域的信息，确定目标存在的具体位置。文献[1]提出了一种基于贝叶斯理论的多UAV鲁棒协同搜索方法，首先建立搜索环境的数学模型，然后考虑到UAV传感器测量的不确定性以及环境自身的不确定性，引入鲁棒性能参数以提高系统的抗干扰性以及稳定性，最后对目标函数进行优化求解，从而引导UAV在区域中进行搜索。任务集结是协同作战的首要行动和自组织协同控制的重要内容，文献[2]为优化集结行动中系统任务状态协调过程能量最优性、协同控制动态响应性和集结行动时效性3个性能指标，采用基于快速一致性控制算法的协同控制结构，在合作博弈框架下给出多无人机系统自组织协同与优化控制问题描述，建立了优化控制输入的Pareto解集，采用Nash讨价还价方法给出基本合作博弈优化一致性控制算法。在基本算法中引入过去状态差值，并以优化目标构建适应度函数，采用遗传算法优化代价函数的加权矩阵，得到改进合作博弈优化一致性控制算法。文献[3]通过考虑合作联盟的目标价值收益指标函数、损伤代价指标函数及航程代价指标函数，建立多无人机联盟合作博弈模型，构建出其博弈矩阵，给出合作联盟特征函数与混合策略纳什均衡的定义，采用粒子群算法(particle swarm algorithm，PSO)求解出混合策略的纳什均衡，并利用Shapley 值方法，给出一种合作博弈的求解方法，最终得到多无人机对地攻防最优对抗策略。文献[4]对目标运动行为的综合利用，以敌我双方为局中人，把敌我双方可能的行为作为策略集，建立博弈论模型，通过求解Nash均衡改进扫描式搜索路径规划算法。文献[5]通过分析实际战场中目标价值和毁伤概率信息的不确定性，提出了不确定信息条件下需要解决的无人机(UAV)攻防博弈问题。以敌我双方发射导弹的价值信息为依据，建立基于不确定信息的多UAV攻防对抗的支付函数，构建攻防双方博弈支付矩阵。将粒子群算法和区间数多属性方案排序方法相结合，给出基于不确定信息下博弈纳什均衡求解方法，为不确定环境下UAV攻防博弈实现最优策略提供了新方法。

　　现在我们考虑一些无人机为降低传输成本，提高自身的利益，会出现不良行为的无人机。无人机的行为有两种类型：协作的无人机总是会协助联盟内其他无人机进行信息传输;不良行为的无人机则表现为在联盟内有时会不参与其他无人机的协作信息传输。为了模拟存在协作无人机和不良行为无人机间的联盟形成过程，建立了基于贝叶斯联盟博弈^[6]模拟无人机间协作传输信息的过程。

基于贝叶-1.jpg