基于贝叶斯博弈的无人机通信延时研究

安防与国防   作者:余益科 时间:2016-09-28来源:电子产品世界

编者按:在无人机通信网络中,无人机之间协同通信已经成为重要的研究方向。本文针对无人机类型的不确定性,基于动态贝叶斯联盟博弈,通过计算无人机在最小通信延迟下的收益,利用贝叶斯联盟博弈来分析无人机的策略选择。此外,利用信念更新机制来发现系统中潜在的联盟成员。仿真表明,获得的联盟结构是纳什稳定的。

摘要:在无人机通信网络中,无人机之间协同通信已经成为重要的研究方向。本文针对无人机类型的不确定性,基于动态贝叶斯联盟博弈,通过计算无人机在最小通信延迟下的收益,利用贝叶斯联盟博弈来分析无人机的策略选择。此外,利用信念更新机制来发现系统中潜在的联盟成员。仿真表明,获得的联盟结构是纳什稳定的。

引言

  多无人机(unmanned aerial vehicle,UAV)协同搜索是多无人机协同的一个重要研究方向。多架UAV同时对一个未知区域进行搜索,目的就是大量获取搜索区域的信息,确定目标存在的具体位置。文献[1]提出了一种基于贝叶斯理论的多UAV鲁棒协同搜索方法,首先建立搜索环境的数学模型,然后考虑到UAV传感器测量的不确定性以及环境自身的不确定性,引入鲁棒性能参数以提高系统的抗干扰性以及稳定性,最后对目标函数进行优化求解,从而引导UAV在区域中进行搜索。任务集结是协同作战的首要行动和自组织协同控制的重要内容,文献[2]为优化集结行动中系统任务状态协调过程能量最优性、协同控制动态响应性和集结行动时效性3个性能指标,采用基于快速一致性控制算法的协同控制结构,在合作博弈框架下给出多无人机系统自组织协同与优化控制问题描述,建立了优化控制输入的Pareto解集,采用Nash讨价还价方法给出基本合作博弈优化一致性控制算法。在基本算法中引入过去状态差值,并以优化目标构建适应度函数,采用遗传算法优化代价函数的加权矩阵,得到改进合作博弈优化一致性控制算法。文献[3]通过考虑合作联盟的目标价值收益指标函数、损伤代价指标函数及航程代价指标函数,建立多无人机联盟合作博弈模型,构建出其博弈矩阵,给出合作联盟特征函数与混合策略纳什均衡的定义,采用粒子群算法(particle swarm algorithm,PSO)求解出混合策略的纳什均衡,并利用Shapley 值方法,给出一种合作博弈的求解方法,最终得到多无人机对地攻防最优对抗策略。文献[4]对目标运动行为的综合利用,以敌我双方为局中人,把敌我双方可能的行为作为策略集,建立博弈论模型,通过求解Nash均衡改进扫描式搜索路径规划算法。文献[5]通过分析实际战场中目标价值和毁伤概率信息的不确定性,提出了不确定信息条件下需要解决的无人机(UAV)攻防博弈问题。以敌我双方发射导弹的价值信息为依据,建立基于不确定信息的多UAV攻防对抗的支付函数,构建攻防双方博弈支付矩阵。将粒子群算法和区间数多属性方案排序方法相结合,给出基于不确定信息下博弈纳什均衡求解方法,为不确定环境下UAV攻防博弈实现最优策略提供了新方法。

  现在我们考虑一些无人机为降低传输成本,提高自身的利益,会出现不良行为的无人机。无人机的行为有两种类型:协作的无人机总是会协助联盟内其他无人机进行信息传输;不良行为的无人机则表现为在联盟内有时会不参与其他无人机的协作信息传输。为了模拟存在协作无人机和不良行为无人机间的联盟形成过程,建立了基于贝叶斯联盟博弈[6]模拟无人机间协作传输信息的过程。

1 系统模型

  如图1所示为无人机目标系统,各个无人机之间能够形成联盟并在彼此间共享目标信息。假设各个无人机位于不同的高度,避免了他们彼此间的碰撞[7]

  无人机的运动模型:

(1)

  其中,是角度,vi是对地速度,ci是常数对应每个无人机的高度,考虑两种类型的无人机成员:协作的无人机和不良行为的无人机。

2 贝叶斯联盟博弈建立

  我们利用贝叶斯联盟博弈形成处理无人机类型的不确定算法[8]表示无人机可能的类型集合,Tw代表协作的无人机,Tm代表不良行为的无人机。

  无人机i的预期收益:

(2)

  其中ai表示平均效用的权重系数,βi表示平均成本的权重系数。对于无人机i来说,是其对同联盟S内其他无人机的联合信念概率,其计算如下:

(3)

  无人机i的效用表示为Ri(S)

(4)

  其中,di(S)表示无人机i加入联盟S后信息传输延时,di=d({i})表示无人机i不加入任何联盟的信息传输延时。

  无人机i传输目标信息到同联盟任何无人机j引起的平均成本为:

(5)

  其中,cij(S)表示无人机i传送目标信息到联盟S内无人机j的平均成本,表示联盟S中无人机的数量。

  为了更多获知不完全信息下无人机的类型,根据当前时隙和历史信念[8]的结果,通过贝叶斯定理[9],每个无人机更新关于其他无人机类型的信念概率。θ=0代表不合作,θ=1代表合作。

  其中,率。

3 基于离散马尔科夫链的联盟形成稳定性分析

  当每个无人机从自身的效益值角度进行联盟组合的调整时,那么状态(联盟结构)之间的变化可以运用马尔科夫链[10]的方法进行分析,以验证贝叶斯联盟形成算法的稳定性。

本文来源于中国科技期刊《电子产品世界》2016年第9期第52页,欢迎您写论文时引用,并注明出处。

1 2

关键词: 贝叶斯联盟博弈 无人机 延时 201610

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章


用户评论

请文明上网,做现代文明人
验证码:
查看电脑版