推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

无人驾驶铰接式车辆强化学习路径跟踪控制算法

更新时间:2020-01-02 21:58:51 大小:2M 上传用户:zhiyao6查看TA发布的资源 标签:无人驾驶路径跟踪控制 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

针对无人驾驶铰接式运输车辆无人驾驶智能控制问题,提出了一种强化学习自适应PID路径跟踪控制算法。首先推导了铰接车的运动学模型,根据该模型建立实际行驶路径与参考路径偏差的模型,以PID控制算法为基础,设计了基于强化学习的自适应PID路径跟踪控制器,该控制器以横向位置偏差、航向角偏差、曲率偏差为输入,以转角控制量为输出,通过强化学习算法对PID参数进行在线自适应整定。最后在实车道路试验中验证了控制器的路径跟踪质量并与传统PID控制结果进行了对比。结果表明,相比于传统PID控制器,强化学习自适应PID控制器能够有效减小超调和震荡,实现精确跟踪参考路径,可以较好地实现系统动态性能和稳态误差性能的优化。


部分文件列表

文件名 大小
无人驾驶铰接式车辆强化学习路径跟踪控制算法.pdf 2M

部分页面预览

(完整内容请下载后查看)
2 0 1 7  
3
农 业 机 械 学 报  
48  
3
卷 第 期  
doi: 10. 6041 /j. issn. 1000-1298. 2017. 03. 048  
驾驶铰辆强跟踪控制算法  
1
12  
1
1
1
1
翾  
翌婷 鑫鑫  
( 1.  
北京大学机械工学院 北京  
100083; 2.  
100085)  
北京技术公司 北京  
: ,  
摘要 驾驶铰驾驶控制问题 出了一化学适应  
PID  
控制法  
, ,  
先推动学模参考的模以  
PID  
控制基础  
PID  
、 、 ,  
控制器 控制器向角以  
计了于强化学的自适应  
控制量为输出 过强化学对  
PID  
进行线适应定 最后了控制器的  
PID  
PID PID  
统  
能够有效减参考径 可以较好地现系统性能和性能的化  
控制结进行了相比于传统  
控制器 化学适应  
控制  
: ; ; ;  
关键词 驾驶 化学踪  
+
: TP273; U463. 32 5  
: A  
: 1000-1298( 2017) 03-0376-07  
文章编号  
中图分类号  
文献标识码  
Reinforcement Learning Algorithm for Path Following  
Control of Articulated Vehicle  
1
12  
1
1
1
1
SHAO Junkai ZHAO Xuan  
YANG Jue ZHANG Wenming KANG Yiting ZHAO Xinxin  
( 1. School of Mechanical EngineeringUniversity of Science and Technology BeijingBeijing 100083China  
2. Beijing Huawei Digital Technologies Co. Ltd. Beijing 100085China)  
Abstract: With the industry 4. 0 embraced a number of contemporary automationdata exchange and  
manufacturing technologiesthe autonomous driving system is widespread. In order to enable the  
autonomous drivingpath following strategies are essential to maintain the normal work of the vehicles.  
The articulated frame steering vehicles ( ASV ) are flexibleefficient and widely implemented in  
agricultureminingconstruction and forestry sectors due to their high maneuverability. The articulated  
vehicle usually composes of two unitsa tractor and a trailerwhich are connected by an articulation  
joint. Howeveras the ASV dynamics are significantly different from the conventional vehicles with front  
wheel steeringthe path following controller derived for conventional vehicles is considered not to be  
applicable for the ASVs. Thus the path following control is challenging the robustness. A path following  
strategy is proposed for the ASVs on the basis of reinforcement learning adaptive PID algorithm. The  
kinematic model of the ASV is derived by neglecting the vehicle dynamics. Three measurable errors are  
defined to indicate the deviation of real path from reference pathi. e. lateral displacement error,  
orientation error and curvature error. These errors are served as the inputs in order to synthesize the path  
following controller and the desired steering angle is served as the output of path following controller.  
Based on the PID algorithmthe reinforcement learning method is selected for optimizing the parameters  
of PID online to reduce the overshoot and chattering. Furthermorethe prototype test is conducted to  
evaluate the performance of the proposed control law. The result shows that compared with the traditional  
PIDreinforcement learning adaptive PID controller can restrain the overshoot and chattering efficiently  
and follow the reference path accurately.  
Key words: articulated vehicle; driving; reinforcement learning; path following  
: 2016-04-18  
: 2016-09-13  
收稿日期  
修回日期  
:
基金项目 技术研究发展计划  
( 863  
)
计划 项目  
( 2011AA060404)  
( FRF-TP-16-004A1)  
和中校基项目  
:
作者简介  
( 1985) , , , E-mail: shao@ ustb. edu. cn  
博士从事驾驶控制研究  
:
通信作者  
( 1975) , , , E-mail: yangjue@ ustb. edu. cn  
男 副教授 主从事计研究  
3
:
驾驶铰化学控制法  
377  
, ,  
点 因的速度前进利  
引言  
11]  
分析计算  
12]  
,  
作为活 机动的备 常  
v
速度 为  
v = v  
( 1)  
地形运作业 使  
f
v——  
m/s  
中  
速度  
控制别  
v ——  
f
m/s  
速度  
控制内外多学进行  
13]  
大量研究 主包括分  
( PID)  
P
速度  
f
1]  
2]  
3]  
4]  
·
制  
制  
x = v cos  
f f  
θ
f
( 2)  
·
{
标  
随着控制器结合多  
y = v sin  
f f  
θ
f
5]  
ASLAM  
和性能提升  
x ——  
f
m  
中  
标  
动力学模进行了控制路  
y ——  
f
m  
6]  
使用  
Ackermann  
———  
rad  
θ
向角  
f
制进行踪  
向角化率速度为  
7]  
TALEBI  
PID  
出一器人的模糊  
PID  
v sin  
f
·
γ
=
( 3)  
θ
f
控制器 将于  
调校  
l cos + l  
γ
f
r
5 - 7]  
所使用的线算法  
l l ——  
f r  
前 后离  
m  
中  
8]  
据使用环线使化学  
———  
rad  
γ
向角  
系统划进行测  
程前的位姿状态表示为  
9]  
10]  
交通等 和出了一种  
P = ( x y , ,) ,  
θ γ  
f
f
f
f
·
化学动机器人用  
cos  
θ
f
x
f
8 - 10]  
均使用  
·
sin  
θ
f
y
f
化学研究问题 问题  
=
v
( 4)  
sin  
γ
·
θ
f
不同  
本文发一结合与  
l cos + l  
γ
f
r
·
PID  
γ
控制径  
0
使验验控制品质 在  
2
P  
地转为 为状  
f
驾驶铰线化  
参考点 因地转面  
6]  
止  
1
型  
1. 1  
型  
2 ,  
可以个运态  
2  
动和地转这 种动  
程进行分析  
1
O  
中 为心  
P ( x y )  
f f f  
P ( x y ) l  
前后点  
r
l
分  
r
r
r
f
前后θ θ 前后体朝向  
r
f
。  
向角 前后夹角 γ 向角 习  
2
地转向示图  
P  
考虑 通常状态参考  
f
Fig. 2 Schematic of articulated vehicle in pivot steering  
P
XY  
的速度量为  
点  
f
·
x = 0  
f
( 5)  
·
{
y = 0  
f
向角化率为  
·
l
·
γ
r
=
( 6)  
θ
f 2  
l cos + l  
γ
f
r
程前的位姿状态表示为  
1
向示图  
P = ( x y , ,) ,  
θ γ  
f
Fig1 Schematic of articulated vehicle in steady-state steering  
f
f
f

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载