推荐星级：

基于强化学习的旋翼无人机智能追踪方法

更新时间：2020-01-01 09:04:06 大小：1M 上传用户：songhuahua 查看TA发布的资源 标签：无人机 下载积分：1分评价赚积分（如何评价?）打赏收藏评论(0) 举报

资料介绍

针对旋翼无人机追踪场景中常用的PID控制方法与视觉伺服控制方法的不足,该文尝试将视觉伺服控制与强化学习结合,提出了一种基于强化学习的旋翼无人机智能追踪方法。首先使用基于图像的视觉伺服实现旋翼无人机的闭环控制,然后建立使用Sarsa学习算法调节伺服增益的强化学习模型,通过训练可以使得旋翼无人机自主选择视觉伺服增益。该文设计了旋翼无人机在实物场景与仿真场景下的运动目标追踪实验,实验结果论证了该方法相对于PID控制与基于图像的视觉伺服控制方法具有更好的追踪效果。

部分文件列表

文件名	大小
基于强化学习的旋翼无人机智能追踪方法.pdf	1M

立即下载

【关注B站账户领20积分】

部分页面预览

（完整内容请下载后查看）

第 48 卷第 4 期

2019年7月

电子科技大学学报

Vol.48 No.4

Jul. 2019

Journal of University of Electronic Science and Technology of China

·计算机工程与应用·

基于强化学习的旋翼无人机智能追踪方法

史豪斌^*，徐梦

(西北工业大学计算机学院西安 710129)

【摘要】针对旋翼无人机追踪场景中常用的PID控制方法与视觉伺服控制方法的不足，该文尝试将视觉伺服控制与强化学

习结合，提出了一种基于强化学习的旋翼无人机智能追踪方法。首先使用基于图像的视觉伺服实现旋翼无人机的闭环控制，

然后建立使用Sarsa学习算法调节伺服增益的强化学习模型，通过训练可以使得旋翼无人机自主选择视觉伺服增益。该文设计

PID

了旋翼无人机在实物场景与仿真场景下的运动目标追踪实验，实验结果论证了该方法相对于

控制与基于图像的视觉伺服控

制方法具有更好的追踪效果。

关

键

词

智能追踪; 强化学习; 旋翼无人机; 视觉伺服

中图分类号 TP39 文献标志码 doi:10.3969/j.issn.1001-0548.2019.04.012

An Intelligent Tracking Method of Rotor UAV Based

on Reinforcement Learning

SHI Hao-bin^*and XU Meng

(School of Computer Science, Northwestern Polytechnical University Xi’an 710129)

Abstract Aiming at the deficiencies of PID control method and visual servo control method commonly used

in the tracking scene of Rotor UAV(unmanned aerial vehicle), this paper attempts to combine visual servo control

with reinforcement learning, and proposes an intelligent tracking method for Rotor UAV based on reinforcement

learning. Firstly, image-based visual servo is used to track the closed-loop control of the Rotor UAV, and then a

reinforcement learning model is established to adjust the servo gain with Sarsa learning algorithm. After many

training sessions, the Rotor UAV can choose its own visual servo gain. In this paper, the experiment of tracking the

moving target of Rotor UAV in physical and simulation scenarios is designed. The experimental results demonstrate

that the proposed method has better tracking effect than PID control and classical image-based visual servo control

method.

Key words intelligent tracking; reinforcement learning; rotorcraft UAV; visual servo

近年来，随着旋翼无人机相关技术的发展，广

大学者对旋翼无人机的追踪与控制问题进行了广泛

的研究^[1-2]。文献[3]针对旋翼无人机追踪地面目标车

辆过程中存在的精度不高以及参数固定的问题进行

研究，提出了一种模糊PID控制方法，但是PID控制

器在处理非线性不确定系统时的抗干扰能力差，控

制精度也不高。文献[4]应用了一种基于位置的视觉

伺服(position-based visual servoing, PBVS)的控制方

法实现旋翼无人机的追踪控制, 但是基于位置的视

觉伺服的误差定义在三维笛卡尔空间，对初始条件、

噪声、摄像机参数误差和目标位姿的估计精度都非

常敏感。文献[5]提出了一种新型的基于图像的视觉

伺服旋翼无人机最优路径规划方法，提高了旋翼无

人机的控制效果。但是基于图像的视觉伺服控制对

于伺服增益的选取大多通过人工赋值的方式，选取

合适的伺服增益值往往依靠经验, 因此该方法不能

很好地在复杂的非线性环境中实现精确的控制。

针对经典的PID控制与基于图像的视觉伺服控

制在旋翼无人机追踪与控制过程中存在的收敛性

差、控制精度不高等问题，本文设计了一种基于强

化学习的旋翼无人机追踪控制方法，通过基于图像

的视觉伺服形成旋翼无人机的闭环反馈控制，结合

强化学习调节伺服增益值，可以实现旋翼无人机智能

系统对于环境的适应能力。

旋翼无人机视觉伺服模型

1.1 基于图像的视觉伺服

旋翼无人机的视觉传感器中的

M 个特征点的

收稿日期：2018  10  24；修回日期：2018  12  24

基金项目：陕西省重点研发计划(2018GY-187)

作者简介：史豪斌 (1978  )，副教授，主要从事人工智能方面的研究. E-mail:

电子科技大学学报

第 48 卷

554

位置坐标为： F  { f_i^cp (x^cp, y^cp)^T| i 

，

1,2,



,M}

设定

为基于图像的视觉伺服的特征误差，即：

C





^des

x₁ x₁



y₁^cp y₁^des

f₁ f₁^des









des

a(x ^xp, y ^xp

(x ^xp, y ^xp

)

x₂ x₂

f₂^cp f₂^des

 R^{2M 1}

y^cp y₂^des

(1)

e 



d_x

d_y



)



f ^cp f_M^des

Z_a









x^cp x^des

o₁









y_M^cp y_M^des

a(x_a, y_a)

式中， f_i^des (x_i^des, y_i^des

)

^T为第个特征点的目标位置

坐标，该值是被唯一确定的。

o₂

对于旋翼无人机动力学模型，有6个自由度的运

动参数，即 v  (v_x,v_y,v_z,_x,_y,_z)^T，但是旋翼无人

A(X_a, Y_a, Z_a)

机是一种线速度与角速度之间强耦合的动力学系

统。根据文献[6]，旋翼无人机在低速运动的状态下，

微小的姿态倾斜角度对视觉的影响可以忽略。本文

设定，考虑当旋翼无人机与地面近乎平行飞行时，

不会由于视觉计算而产生滚转角与俯仰角，同时在

实际应用场景中，旋翼无人机的滚转角与俯仰角值

图1 旋翼无人机的视觉模型

设定数字图像中，r,c 分别表示行像素值与列像

素值，数字图像的中心点所在的行数为 _d，列数为

2c_d，设定A点在数字图像中的像素值行数为 _r，列

数为 _c，可以得到：

几乎为零，因此考虑 v  (v_x,v_y,v_z,_z)^T

。





 r  a_r

根据特征误差与视觉传感器运动之间的关系为

(3)



y^px c_d a_c





de / dt  Jv ，其中就是图像关联矩阵。为了计算

由数字图像与成像平面的映射关系可以得到：

方便，将视觉坐标系统 C 与旋翼无人机的惯性坐

x a





x  d x

标系统

统一，旋翼无人机的前进与后退方向在

E

(4)



y  d y^px





轴，左右移动方向为轴。在一个理想的情景下，

建立像素平面到三维视觉坐标系中任意空间点

设定

为视觉坐标系统 C 空间中的一个三维坐标

，单位为mm。设定A点在

的映射关系：

点，坐标记为

(X_a,Y_a,Z_a)

底部视觉传感器的图像平面上的成像点



^px

x_a

y_a^px

 fa / d

 fa / d_y

  





的坐标为

  ^a





(5)



Y_a

(x_a, y_a) ，单位为 mm ，在数字图像中的坐标为

(x_a^px, y_a^px) ，单位为pixel，成像模型如图1所示。

 











Z_a









 





在底部视觉模型中引入放缩比例为 (d_x,d_y)

方向上的每一个像素，在成像图像平面上表

示为个单位长度，相机的焦距为。图像平面的

，d_x

由此旋翼无人机的底部视觉模型建立完成。其

表示

中

d_x,d_y, f 为旋翼无人机中视觉传感器的固有参

d_x

中心坐标在 C 中的坐标记为 (0,0, f )

在图像平面中以图像中心点为原点的坐标，

数，可以通过相机标定等方式来获得。

，

(x_a, y_a) 为

1.2 旋翼无人机的动力学扩展

旋翼无人机通过改变4个推进器的转动速度，可

以控制旋翼无人机上下运动。如果控制第一和第三

推进器的旋转速度，会引起俯仰运动；如果控制第

二和第四推进器的旋转速度，会引起翻滚运动；通

过共同调节第一、第二、第三和第四推进器的旋转

速度，可使旋翼无人机产生偏航运动。旋翼无人机

具体的推进器转子的旋转速度是由给定的加速度参

数来实现控制的。其函数关系如式(6)所示：

[₁,₂,₃,₄]^T J_a[a_x^v,a^v_y,a_z^v,a^_x,a^_y,a_z^]^T(6)

点

(x^px, y^px) 是数字图像中以其中心点为原点的坐标。

在理想情况下，视觉坐标系统与图像平面坐标系、

像素平面坐标系的原点重合，根据几何学得到数学

关系如式(2)所示：

 fa

 





  _a

 

 



y 

Y_a

a  0

(2)

 









Z_a

 





全部评论(0)

暂无评论

评论赚积分>>

上传资源上传优质资源有赏金

最新上传

打赏
30日榜单

21ic小能手打赏5.00元 3天前

资料：家庭服务机器人(互联网+创新创业计划书)
21下载积分打赏1.00元 3天前

用户：德才兼备
mulanhk 打赏1.00元 3天前

资料：基于DS1621的12位AD转换与12864液晶显示系统研究(原创)
21ic小能手打赏10.00元 3天前

资料：51单片机智能导盲拐杖（程序+仿真+原理图+PCB+材料清单）
21ic小能手打赏5.00元 3天前

资料：51单片机的温度控制系统（全套）
21ic小能手打赏3.00元 3天前

资料：51单片机超声波测距（全套）
21ic小能手打赏5.00元 3天前

资料：51单片机的（1302）时钟带仿真＋原理图
21ic小能手打赏5.00元 3天前

资料：51单片机的酒精浓度检测系统设计（全套）
21ic小能手打赏10.00元 3天前

资料：51单片机的单片机数字频率计（全套）
21ic小能手打赏5.00元 3天前

资料：51单片机的红外遥控器设计proteus仿真（全套）
21ic小能手打赏5.00元 3天前

资料：51单片机简易数字示波器（程序+仿真+全套资料）
21ic小能手打赏3.00元 3天前

资料：51单片机的空气检测（空气质量温度湿度）[全套]
21ic小能手打赏3.00元 3天前

资料：51单片机的全自动洗衣机仿真电路程序原理图设计简单文档
21ic小能手打赏5.00元 3天前

资料：51单片机十字路口交通灯课设（全套）
21ic小能手打赏5.00元 3天前

资料：51单片机数字电压表的设计（全套）
21ic小能手打赏5.00元 3天前

资料：51单片机的八路抢答器（全套）
21ic小能手打赏5.00元 3天前

资料：51单片机的停车场车位管理系统（全套）
21ic小能手打赏5.00元 3天前

资料：51单片机温控风扇（含程序+原理图+仿真+PCB）（全套）
21ic小能手打赏5.00元 3天前

资料：数控电子负载-CH552
21ic小能手打赏5.00元 3天前

资料：Multism的函数发生器（方波和三角波）(全套)仿真 PCB 报告原理图
21ic小能手打赏5.00元 3天前

资料：OpenClaw_云服务器部署全指南（2026_年_3_月版）

21ic下载打赏310.00元 3天前

用户：zhengdai
21ic下载打赏310.00元 3天前

用户：liqiang9090
21ic下载打赏330.00元 3天前

用户：jh0355
21ic下载打赏210.00元 3天前

用户：小猫做电路
21ic下载打赏240.00元 3天前

用户：jh03551
21ic下载打赏210.00元 3天前

用户：gsy幸运
21ic下载打赏70.00元 3天前

用户：w178191520
21ic下载打赏60.00元 3天前

用户：sun2152
21ic下载打赏80.00元 3天前

用户：江岚
21ic下载打赏60.00元 3天前

用户：xuzhen1
21ic下载打赏20.00元 3天前

用户：kk1957135547
21ic下载打赏40.00元 3天前

用户：潇潇江南
21ic下载打赏20.00元 3天前

用户：w993263495
21ic下载打赏20.00元 3天前

用户：w1966891335
21ic下载打赏70.00元 3天前

用户：有理想666
21ic下载打赏35.00元 3天前

用户：xzxbybd
21ic下载打赏15.00元 3天前

用户：x15580286248
21ic下载打赏25.00元 3天前

用户：铁蛋锅
21ic下载打赏35.00元 3天前

用户：mulanhk

基于强化学习的旋翼无人机智能追踪方法

资料介绍

部分文件列表

部分页面预览

相关下载

全部评论(0)

热门标签

最新上传

热门下载

资料专题

推荐下载

专栏首页