-
近些年,多无人机(Multi Unmanned Aerial Vehicles, 简称Multi-UAV)任务分配问题受到人们的广泛关注,旨在将无人机分组,组成联盟,从而更高效快捷地完成任务。而资源分配问题是为了完成目标任务,确定无人机拥有的资源数量。随着控制技术、通讯技术、传感器技术和智能调度技术的快速发展[1-3],任务分配问题已广泛应用于生产规划、货物运输和工作安排等,而多无人机任务分配更是广泛应用于军事、农业、服务业等领域。由于单个无人机资源有限,很难完成现实中复杂多变的任务,因此为了更有效地解决军事上的复杂问题,应采用多无人机联盟。
国内外的学者对任务分配问题已进行了大量的研究。Chopra等[4]提出了匈牙利方法的分布式来解决任务分配问题。在多无人机应用的情况下,所有无人机协同计算共同分配,在对等网络进行有限局部计算。Lee等[5]提出了一种基于市场机制的拍卖算法,在执行任务期间,无人机会不断消耗其资源,这些资源必须在运行期间重新填充。在该算法中,考虑了无人机的资源,从而也产生相应的成本。同样的,Jiao等[6]提出了基于拍卖的市场模型,有效地最大化区块链网络的社会福利,并为云/雾计算服务供应商提供有效的策略。Kurdi等[7]提出了一种新的自主生物启发方法,在执行任务期间,利用该方法对多个无人机进行高效地分配任务。每个无人机根据与各个无人机运行状态和任务参数有关的标准动态调整任务分配,而无需积极参与任务的无人机之间进行直接通信。Fang等[8]提出了一种基于情绪传染(PTA-EC)的任务分配算法,建立了人格和情感模型,并将人格映射到行为并设计了情感互动。Sarker等[9] 提出了一种自组织的多机器人任务分配算法,研究了集中通信策略下的性能。这些结果表明本地策略可以在集中任务策略方面提高系统性能,降低总体通信吞吐量,并降低了通信成本,从而扩展了对通信效果的理解。所采用的框架是从对蚂蚁,人类和机器人社会系统的观察中得出的自组织分工的通用模型。Gulpinar[10]提出了一种构造启发式算法,该算法基于估计的边际效用,将代理和资源按顺序分配给任务。基于这种启发式算法,还提出了各种近似动态规划方法和一种进化算法。Jin, Long[11]提出了一种分布式协调模型,针对竞争性有限的通信,以竞争性方式为多个非完整机器人开发了一种新的协调控制。在这种建议的控制方法中,只有比赛的获胜者才会得到任务并被激活以朝着目标前进。
在现有的研究中,假定无人机具有能力来自动执行任务,以及任务分配框架只专注于最大限度地减少总成本。资源在任务分配中,尚未广泛考虑任务的难度、任务的成功率以及任务的个数。现实情况是无人机没有足够的资源和能力来执行每一项任务,任务也是多变的,这限制了无人机的能力。在完成特定任务中,如果无人机数量不足,联盟可能无法成功完成任务。或者,该联盟能够完成任务,倘若再加入几架无人机,任务的成功率和效能可能更高。
本文提出了一种基于资源的建模方法和多无人机任务分配算法,旨在为每个任务分配最佳的联盟组合,同时考虑了任务执行的成功率和效能。
-
将
$\mathop R \nolimits_n$ 表示为任务所需的资源,其中n=1,2,...,n是资源索引,R是资源类型。表1阐述了6种资源模型及相关参数,
$\mathop R\nolimits_1 $ 表示相机,其像素为1400万,分辨率为4536×3024;$\mathop R\nolimits_{\rm{2}} $ 表示声纳,其传播距离为10 km,发射频率为30000 Hz;$\mathop R\nolimits_{\rm{3}} $ 表示机油,其数量为20 kg;$\mathop R\nolimits_{\rm{4}} $ 表示弹药,其数量为20 kg;$\mathop R\nolimits_{\rm{5}} $ 表示雷达,其探测距离为10 km;$\mathop R\nolimits_{\rm{6}} $ 表示传感器,其分辨率为±0.01 ℃。Serial Number Name of Resources Quantity of Resources 1 Camera Pixel:14 million,Resolution
Ratio:4536×30242 Sonar Distance of transmission:10 km,
Frequency:30000 Hz3 Machine Oil 20 Kilograms 4 Ammunition 20 kg 5 Radar Distance of detection:10 km 6 Sensor Resolution Ratio:±0.01 ℃ 表 1 无人机的资源
Table 1. Resources of UAV
-
$\mathop U\nolimits_{\rm{i}} $ 表示携带资源的无人机,$\mathop N\nolimits_{\rm{i}}$ 表示第i个无人机拥有资源的数量,如下所示:其中
$\mathop N\nolimits_{{\rm{in}}} $ 表示无人机$\mathop U\nolimits_{\rm{n}} $ 所拥有的资源数量,$\mathop R\nolimits_{{\rm{in}}} $ 表示无人机$\mathop U\nolimits_n $ 资源数量的数学值。此外,定义资源约束任务
$\mathop T\nolimits_i$ 施加的无人机联盟C的约束,联盟级别约束通过任务$\mathop T\nolimits_i $ 反映了高级资源需求,即促进联盟中的多个无人机拥有分组完成任务$\mathop T\nolimits_i $ 的能力。强调多个无人机的协作技能,例如一个无人机视觉系统引导其他多个无人机执行攻击任务。定义$\mathop N\nolimits_i^u $ 为执行任务$\mathop T\nolimits_i $ 时联盟必须拥有的资源数量,如下所示此外,每个联盟可能要执行多个任务,任务的难度有所不同,因此将任务的难度定义为
$\mathop D\nolimits_T $ ,$\mathop D\nolimits_T $ 与任务所需资源、时间有关,需要的资源越多,花费的时间越多,表示该任务难度越大,因此可以将$\mathop D\nolimits_{{\rm{T}}} $ 定义为并且
$\mathop D\nolimits_T$ 的函数为[10] -
任务分配TA算法主要考虑的是将多个任务分配给无人机联盟,之前提出的Leader-follower联盟算法主要是通过启发的方式来形成多无人机联盟,而任务分配算法(Task Allocation Algorithm,简称TA算法)是通过计算的方式来实现多无人机的分组,计算每个分组方式执行任务的效能值U、奖励值R、代价函数值C和成功率
$\mathop S\nolimits_{TC{\rm{tr}}} $ ,将任务分配给成功率和效能值最大的组合,从而可以更高效地完成任务。算法核心如下1.Input n UAVs and m Tasks
2.then n UAVs will be allocated to m Tasks
3.Output n!/(n-m)! Possible scenarios
4.While n<m do
5.
$ C(T,U)$ 6.
$ {\rm{If}}\;C(T,U)>{\rm{threshold,then}}$ 7. Cancel these groups
8.
$ {\rm{Else}}\;{\rm{if}}\;C(T,U)<{\rm{threshold,then}}$ 9.
$\mathop S\nolimits_{TC{\rm{tr}}} $ 10.
$\displaystyle\sum U =\displaystyle\sum {(R - C)}$ 11.
${\rm{choose}}\;{\rm{Max}}\displaystyle\sum {{\rm{U}}\;{\rm{and}}\;{\rm{Max }}\mathop {\rm{S}}\nolimits_{{\rm{TCtr}}} }$ 12. end
13. else
-
每架无人机具有相同的能力和技能,并且是同类型的无人机,在给定的时间t内,根据资源来定义决策变量,将资源r分配给无人机u来执行任务T,用
$\mathop R\nolimits_{{\rm{Tru}}} $ 表示该资源的数量。$\mathop X\nolimits_{{\rm{TCtr}}} $ 是一个二维变量,表示无人机联盟C在时间t使用资源r完成任务T产生的影响,当任务T在时间t分配给无人机联盟C时,$\mathop X\nolimits_{{\rm{TCtr}}} $ 为1,否则为0。因此,可以在时间t将任务T分配给联盟C,来定义任务执行的成功率[12]
$\mathop {\rm{s}}\nolimits_{{\rm{TCtr}}} $ , -
代价函数是衡量多无人机联盟在执行任务的过程中所产生不理想结果的函数。首先,在执行任务的过程中,飞机会不断消耗机油和弹药,这会产生很大的成本;其次,飞机在飞行的过程可能会发生其它系统损坏,导致飞机坠毁;然后,任务初期,可能还有一些飞机不执行任务,在空中悬停,这也会产生一定的成本,这些都会影响无人机联盟执行任务的成功率。因此,飞机的成本函数可以描述为[13]
式中,r表示无人机的总数;
$\mathop n\nolimits_s $ (T)表示在任务区域,执行T任务的无人机数量;$\mathop n\nolimits_{{\rm{crash}}} $ (T)表示执行任务T时,发生坠毁的无人机数量;$\mathop n\nolimits_{\rm{f}} $ (T)表示执行任务T时,消耗弹药和机油的数量;$\mathop C\nolimits_{{\rm{loc}}} $ 、$\mathop C\nolimits_{{\rm{crash}}} $ 、$\mathop C\nolimits_{\rm{b}} $ 和$\mathop C\nolimits_{\rm{f}} $ 分别表示无人机不执行任务、发生坠毁、消耗弹药和机油所产生的成本。此外,在许多无人机任务分配的应用中,为了确定无人机联盟是否执行任务,任务执行情况,增加了通信中继的应用程序,确保无人机之间、基地和无人机之间可以相互交流通信[12-15]。人工操作人员或基于地面的操作系统可以使用此程序向无人机发送命令,或收集和分析来自无人机的实时传感器数据。例如,在配备摄像头的无人机进行搜索和攻击的任务中,操作人员可能需要观察来自每个无人机的实时视频。为了确定敌方的可能位置。此外,在许多情况下每个无人机的通信范围可能会受到限制,特别是可能小于基地和监视区域之间的距离。因此,在这种情况下,有必要形成通信“链”,由空间分隔的一串无人飞行器组成,用于中继消息在基地和任务执行区之间来回传递。
为了建立通信链的需求建模公式中,代价函数C(T,U)按以下方式修改为[13]
其中,m(T)取值0或1,当无人机之间存在通信联系时,m(T)取1,否则取0。
-
尽管执行任务会产生一定的成本,但是任务执行成功也会获取相应的奖励,每成功地执行完一个任务,无人机都会获取相应的奖励[13]
其中,
$\mathop a\nolimits_{\rm{it}} $ 表示任务分配参数,任务是否被分配,若已分配任务,则取1,否则取0;$\mathop R\nolimits_{\rm{it}} $ 表示单个无人机所获取的奖励,$\mathop R\nolimits_{{\rm{it}}} ={\rm{1 - }}\mathop e\nolimits^{ - au} $ ,a表示弹药的性质,u表示弹药的数量;$\mathop s\nolimits_{{\rm{TCtr}}}$ 表示任务执行的成功率。 -
在执行任务的过程中,每当这个联盟执行完一个任务就会更新这个效能函数值,效能函数由奖励函数和代价函数两部分组成,奖励函数值减去代价函数值即为效能值,效能函数[12-13]U如下
-
为了验证该算法的有效性,在Matlab环境下进行仿真实验,该实验将3组任务,共15个任务分配给40架无人机,每架无人机拥有的资源是相同的,因此,经过计算,3组任务的实验数据如下,这三组数据的结果为任务分配的最优结果,即成功率和效能值最高。如下
Task UAV Number Success Rate Reward Cost Utility 1 3 0.82 21.96 7.43 14.53 2 4 0.75 20.90 8.52 12.38 3 6 0.80 20.28 6.54 13.74 4 3 0.87 20.12 5.17 14.95 5 11 0.90 24.74 9.32 15.42 6 3 0.78 20.59 8.02 12.57 表 2 第一组任务分配实验数据
Table 2. The first set of experimental data on task allocation
Task UAV Number Success Rate Reward Cost Utility 1 7 0.92 22.81 7.03 15.78 2 5 0.74 20.63 7.42 13.21 3 7 0.86 27.61 6.13 14.85 4 12 0.79 20.09 6.06 14.03 5 9 0.90 23.16 8.12 15.04 表 3 第二组任务分配实验数据
Table 3. The second set of experimental data on task allocation
Task UAV Number Success Rate Reward Cost Utility 1 9 0.86 21.29 6.33 14.96 2 4 0.81 22.63 8.60 14.03 3 3 0.92 22.84 7.52 15.32 4 9 0.77 20.92 7.38 13.54 表 4 第三组任务分配实验数据
Table 4. The third set of experimental data on task allocation
此外,也在Matlab环境下做了仿真动画,来进一步验证该算法的有效性。动画中,五角星表示无人机,虚线代表飞行的路线,圆形表示无人机飞行的范围,三角形表示任务点位置,三角形面积大小表示任务难度,颜色变化反映了任务得执行进展,分别是深红、橙色、黄色、绿色和蓝色,其中深红表示任务还未执行,蓝色表示任务执行完毕。另外,在动画的中央设定了一个飞机场,无人机从飞机场出发,如图1左所示。首先,第一批任务共有6个任务,由于任务相对简单,故只由25架飞机来执行这些任务,其他飞机在飞机场内待命。这6个任务中如果有任务提前完成,该任务点就消失,同时飞机在原地盘旋,等待被分配第二批任务,如图1右所示。第二组任务共有5个任务,且难度较高,40架飞机全部执行任务,如图2左所示,同样的,当某项任务先执行完毕后,任务点就会消失,如图2右所示。当执行完第二批任务后,有15架飞机发现油量和弹药不足,不能继续执行接下来的任务,故这15架无人机先返回飞基地,由剩余25架无人机执行第三组任务,如图3所示。
-
在利用matlab得到理想的效果和数据后,也不能确定所采用的TA算法具有优越性,于是,将该算法与遗传算法[17]、匈牙利算法[4]和拍卖算法[6]进行了对比,对比分析了在这些算法的框架下,飞机执行任务的成功率、奖赏值、代价值和效能值。由于仿真实验的任务众多,故只对比分析每一轮任务的第一个任务,实验数据对比如下:
Algorithm Success Rate Reward Cost Utility TA 0.82 21.96 7.43 14.53 Genetic 0.72 22.65 8.63 14.02 Hungarian 0.69 20.54 6.09 13.45 Auction 0.62 21.54 9.17 12.37 表 5 不同算法下第一轮第一个任务实验数据对比
Table 5. Comparison of experimental data of the first round of the first taskunder different algorithms
Algorithm Success Rate Reward Cost Utility TA 0.92 22.81 7.03 15.78 Genetic 0.84 23.24 8.23 15.01 Hungarian 0.69 22.86 8.54 14.32 Auction 0.62 23.08 9.32 13.76 表 6 不同算法下第二轮第一个任务实验数据对比
Table 6. Comparison of experimental data of the second round of the first taskunder different algorithms
Algorithm Success Rate Reward Cost Utility TA 0.82 21.29 6.33 14.96 Genetic 0.74 20.81 6.49 14.32 Hungarian 0.69 20.56 7.02 13.54 Auction 0.62 19.53 7.47 12.06 表 7 不同算法下第三轮第一个任务实验数据对比
Table 7. Comparison of experimental data of the third round of the first taskunder different algorithms
通过上述数据对比分析,可以得出TA算法具有一定的优越性,在该算法框架下,任务执行的成功率最高且效能值最大。
-
研究了基于资源的多无人机任务分配,提出了一种任务分配算法,重点介绍了在该算法的有效性,同时考虑了任务的成功率、奖励值、代价值和效能值,将任务分配给最佳的无人机组合,从而提升了任务分配的准确性以及任务的成功率。为了验证该算法的有效性,在Matlab中进行了仿真实验,做了仿真动画,并且对比了该算法与遗传算法、匈牙利算法和拍卖算法的成功率、奖赏值、代价值和效能值,试验结果表明证明了该算法可以大大提升任务的成功率和效能值。
基于资源约束的多无人机联盟的任务分配
Research on Task Allocation of Multi-UAV Coalition Based on Resource Constraints
-
摘要: 随着现在无人机作战任务日趋复杂,单个无人机可能没有足够的资源单独完成分配的任务,因此,无人机必须组成联盟来共同执行任务,从而更高效地完成任务。同时,根据任务难度的不同,本文提出了相应的任务分配算法,也计算了每个联盟执行每个任务的成功率和效能,从而选择效能最大的联盟来执行该任务。为了验证该算法的有效性,在matlab中进行了仿真实验分析和对比,实验数据表明,多无人机联盟执行任务可以大大提高任务执行的成功率和效能。Abstract: As the combat missions and environments of unmanned aerial vehicles(UAV) are becoming increasingly complicated, a UAV may not have sufficient resources to complete the assigned tasks. In this sense, it is necessary that the unmanned aerial vehicles should form a coalition so that they can accomplish the complex tasks more efficiently and improve the success rate as well as effectiveness of tasks in large measure. This paper has provided insight into multi-UAV task allocation algorithm amid military environment. The main research work is as follows: First and foremost, based on the various tasks that are required by the UAV resources, a resource model is established. Besides, quantitative calculation of various resources required by the UAV Alliance was carried out. At the same time, according to the difficulty of the task, this paper proposes a task allocation(TA) algorithm, and also calculates the reward, costs, success rate and effectiveness of each coalition to perform each task. There is no denying that these endeavors will make for selecting the best alliance with the most effectiveness as a way to carry out the task. These efforts has improved the robustness and versatility of the algorithm significantly. In order to verify the effectiveness of the algorithm, simulation experiments were carried out in matlab. In addition, in a bid to make human-computer interaction more economical and safer, the above mentioned task allocation algorithm, the auction algorithm, leader-follower algorithm and the Hungarian algorithm are compared in success rate and effectiveness. At last, the experimental data shows that the UAV coalition can significantly improve the success rate and effectiveness of task execution.
-
Key words:
- UAV /
- coalition /
- resources /
- success rate /
- effectiveness
-
表 1 无人机的资源
Table 1. Resources of UAV
Serial Number Name of Resources Quantity of Resources 1 Camera Pixel:14 million,Resolution
Ratio:4536×30242 Sonar Distance of transmission:10 km,
Frequency:30000 Hz3 Machine Oil 20 Kilograms 4 Ammunition 20 kg 5 Radar Distance of detection:10 km 6 Sensor Resolution Ratio:±0.01 ℃ 表 2 第一组任务分配实验数据
Table 2. The first set of experimental data on task allocation
Task UAV Number Success Rate Reward Cost Utility 1 3 0.82 21.96 7.43 14.53 2 4 0.75 20.90 8.52 12.38 3 6 0.80 20.28 6.54 13.74 4 3 0.87 20.12 5.17 14.95 5 11 0.90 24.74 9.32 15.42 6 3 0.78 20.59 8.02 12.57 表 3 第二组任务分配实验数据
Table 3. The second set of experimental data on task allocation
Task UAV Number Success Rate Reward Cost Utility 1 7 0.92 22.81 7.03 15.78 2 5 0.74 20.63 7.42 13.21 3 7 0.86 27.61 6.13 14.85 4 12 0.79 20.09 6.06 14.03 5 9 0.90 23.16 8.12 15.04 表 4 第三组任务分配实验数据
Table 4. The third set of experimental data on task allocation
Task UAV Number Success Rate Reward Cost Utility 1 9 0.86 21.29 6.33 14.96 2 4 0.81 22.63 8.60 14.03 3 3 0.92 22.84 7.52 15.32 4 9 0.77 20.92 7.38 13.54 表 5 不同算法下第一轮第一个任务实验数据对比
Table 5. Comparison of experimental data of the first round of the first taskunder different algorithms
Algorithm Success Rate Reward Cost Utility TA 0.82 21.96 7.43 14.53 Genetic 0.72 22.65 8.63 14.02 Hungarian 0.69 20.54 6.09 13.45 Auction 0.62 21.54 9.17 12.37 表 6 不同算法下第二轮第一个任务实验数据对比
Table 6. Comparison of experimental data of the second round of the first taskunder different algorithms
Algorithm Success Rate Reward Cost Utility TA 0.92 22.81 7.03 15.78 Genetic 0.84 23.24 8.23 15.01 Hungarian 0.69 22.86 8.54 14.32 Auction 0.62 23.08 9.32 13.76 表 7 不同算法下第三轮第一个任务实验数据对比
Table 7. Comparison of experimental data of the third round of the first taskunder different algorithms
Algorithm Success Rate Reward Cost Utility TA 0.82 21.29 6.33 14.96 Genetic 0.74 20.81 6.49 14.32 Hungarian 0.69 20.56 7.02 13.54 Auction 0.62 19.53 7.47 12.06 -
[1] 杜永浩, 邢立宁, 蔡昭权. 无人飞行器集群智能调度技术综述[J]. 自动化学报, 2020, 46(2): 222-241h.
[2] 姚楚阳, 刘爽. 一种可升降式变电站室内巡检机器人控制系统设计[J]. 华东理工大学学报(自然科学版), 2020, 46(0): 1-7.
[3] 史先鹏, 刘士荣, 刘斐, 等. 非完整移动机器人的神经网络滑模自适应轨迹跟踪控制[J]. 华东理工大学学报(自然科学版), 2010, 36(5): 695-701. doi: 10.3969/j.issn.1006-3080.2010.05.017
[4] CHOPRA S, NOTARSTEFANO G, RICE M, et al. A distributed version of the hungarian method for multirobot assignment[J]. IEEE Transactions on Robotics, 2017, 33(4): 932-947. doi: 10.1109/TRO.2017.2693377 [5] LEE D. Resource-based task allocation for multi-robot systems[J]. Robotics and Autonomous Systems, 2018, 103(5): 151-161. [6] JIAO Y, WANG P, NIYATO D, et al. Auction mechanisms in cloud/fog computing resource allocation for public blockchain networks[J]. IEEE Transactions on Parallel and Distributed Systems, 2019, 30(9): 1975-1989. doi: 10.1109/TPDS.2019.2900238 [7] KURD H, AlOBOUD E, AlALWAN M, et al. Autonomous task allocation for multi-UAV systems based on the locust elastic behavior[J]. Applied Soft Computing, 2018, 71(6): 110-126. [8] FANG B, GUO X, WANG Z, et al. Collaborative task assignment of interconnected, affective robots towards autonomous healthcare assistant[J]. Future Generation Computer Systems, 2019, 92: 241-251. doi: 10.1016/j.future.2018.09.069 [9] LIU Y, SONG R, BUCKNALL R, et al. Intelligent multi-task allocation and planning for multiple unmanned surface vehicles (USVs) using self-organising maps and fast marching method[J]. Information Sciences, 2019, 496: 180-197. doi: 10.1016/j.ins.2019.05.029 [10] GULPINAR N, CANAKOGLU E, BRANKE J, et al. Heuristics for the stochastic dynamic task-resource allocation problem with retry opportunities[J]. European Journal of Operational Research, 2018, 266(1): 291-303. doi: 10.1016/j.ejor.2017.09.006 [11] JIN L, LI S, LA H M, et al. Dynamic task allocation in multi-robot coordination for moving target tracking: A distributed approach[J]. Automatica, 2019, 100(100): 75-81. [12] CHEN J, SUN D. Resource constrained multirobot task allocation based on leader-follower coalition methodology[J]. The International Journal of Robotics Research, 2011, 30(12): 1423-1434. doi: 10.1177/0278364910396552 [13] GULPINAR N, CANAKOHLU E, BRANKE J, et al. Heuristics for the stochastic dynamic task-resource allocation problem with retry opportunities[J]. European Journal of Operational Research, 2018, 266(1): 291-303. doi: 10.1016/j.ejor.2017.09.006 [14] YANG J, YOU X, WU G, et al. Application of reinforcement learning in UAV cluster task scheduling[J]. Future Generation Computer Systems, 2019, 95: 140-148. doi: 10.1016/j.future.2018.11.014 [15] HUANG L, QU H, ZUO L, et al. Multi-type UAVs cooperative task allocation under resource constraints[J]. IEEE Access, 2018, 6: 17841-17850. doi: 10.1109/ACCESS.2018.2818733 [16] LIU Y, NEJAT G. Multirobot cooperative learning for semiautonomous control in urban search and rescue applications[J]. Journal of Field Robotics, 2016, 33(4): 512-536. doi: 10.1002/rob.21597 [17] CHENG L, HOU Z, TAN M, et al. A mean square consensus protocol for linear multi-agent systems with communication noises and fixed topologies[J]. IEEE Transactions on Automatic Control, 2014, 59(1): 261-267. doi: 10.1109/TAC.2013.2270873 [18] WANG Z, LIU L, LONG T, et al. Multi-UAV reconnaissance task allocation for heterogeneous targets using an opposition-based genetic algorithm with double-chromosome encoding[J]. Chinese Journal of Aeronautics, 2017, 31(2): 339-350. -