推荐星级:
- 1
- 2
- 3
- 4
- 5
一种深度强化学习的雷达辐射源个体识别方法
资料介绍
针对传统依赖于人工经验提取辐射源个体特征的不足,提出一种基于深度强化学习的雷达辐射源个体识别方法。利用发射机非理想信道造成的辐射源信号包络在信号变化时呈现的不同瞬态信息,以信号包络前沿作为深度神经网络的输入状态,以辐射源类别作为当前输入状态的可选动作,通过卷积神经网络自动提取辐射源包络个体特征,并拟合当前状态动作对的Q值,进而以强化学习模型完成雷达辐射源个体识别任务。讨论了深度Q网络模型、深度双Q网络模型以及Dueling Network模型3种深度强化学习模型在辐射源识别任务中的应用。实测数据仿真实验表明:传统机器学习算法的识别率不足80%,而深度强化学习网络的识别率高达98. 42%.
部分文件列表
文件名 | 大小 |
一种深度强化学习的雷达辐射源个体识别方法.pdf | 2M |
部分页面预览
(完整内容请下载后查看)39
12
Vol. 39 No. 12
Dec. 2018
第
卷第
期
兵
工
学
报
2 0 1 8
12
ACTA ARMAMENTARII
年
月
一种深度强化学习的雷达辐射源个体识别方法
,
冷鹏飞 徐朝阳
(
723
,
研究所 江苏 扬州
225001)
中国船舶重工集团有限公司 第
: ,
摘要 针对传统依赖于人工经验提取辐射源个体特征的不足 提出一种基于深度强化学习的
。
雷达辐射源个体识别方法 利用发射机非理想信道造成的辐射源信号包络在信号变化时呈现的不
, ,
同瞬态信息 以信号包络前沿作为深度神经网络的输入状态 以辐射源类别作为当前输入状态的可
, , Q ,
选动作 通过卷积神经网络自动提取辐射源包络个体特征 并拟合当前状态动作对的 值 进而以
。 Q 、 Q
强化学习模型完成雷达辐射源个体识别任务 讨论了深度 网络模型 深度双 网络模型以及
Dueling Network
3 。
模型 种深度强化学习模型在辐射源识别任务中的应用 实测数据仿真实验表
:
明 传统机器学习算法的识别率不足
80% ,
而深度强化学习网络的识别率高达
98. 42% .
: ; ; ;
关键词 雷达 辐射源个体识别 深度神经网络 强化学习
+
: TN971 . 1
: A
: 1000-1093( 2018) 12-2420-07
文章编号
中图分类号
文献标志码
DOI: 10. 3969 /j. issn. 1000-1093. 2018. 12. 016
Specific Emitter Identification Based on Deep Reinforcement Learning
LENG Peng-fei,XU Chao-yang
( No. 723 Institute,China Shipbuilding Industry Corporation,Yangzhou 225001,Jiangsu,China)
Abstract: A specific emitter identification ( SEI) method based on deep reinforcement learning is pro-
posed on account of the deficiency of emitter individual feature extraction depending on artificial experi-
ence. Due to the differences of the transient information of signal envelope,which results from the change
of the signal owing to a nonideal transmitter channel,an envelope rising edge is used as the input state of
deep neural network,and the emitter classifications are used as the optional actions of the current input
state. The envelope features are extracted automatically through the convolutional neural network
( CNN) ,and Q values of the current state action pairs are fitted,thus completing the specific emitter i-
dentification task based on the reinforcement learning model. The applications of deep Q network
( DQN) ,deep double Q network ( DDQN) and Dueling network in the specific emitter identification are
discussed. The measured results show that the recognition rate of traditional machine learning algorithm is
less than 80% ,but the deep reinforcement learning model can achieve the high recognition rate of
98. 42% .
Key words: radar; specific emitter identification; deep neural network; reinforcement learning
: 2018-05-07
收稿日期
:
( 2016
)
年
基金项目 装备预研船舶重工联合基金项目
( 1994—) , 。E-mail: ttl_eye@ 163. com
硕士研究生
:
,
作者简介 冷鹏飞
男
:
通信作者 徐朝阳
( 1968—) ,
, ,
研究员 硕士生导师
。E-mail: edaxcy@ vip. sina. com
男
12
2421
第
期
一种深度强化学习的雷达辐射源个体识别方法
0
引言
,
在雷达对抗领域中 雷达辐射源识别技术是电
,
子对抗情报分析领域中的重要研究内容 其水平是
衡量电子侦察系统和侦察设备信息处理技术先进程
[1]
。
度的重要标志
雷达辐射源个体识别技术通过
[2]
,
当前雷
脉内无意调制特征区分雷达的不同个体
达辐射源识别问题的一个研究热点为提取辐射源的
1
图
一种电子侦察设备个体识别框图
Fig. 1 Block diagram of specific emitter identification of
electronic reconnaissance equipment
[3]
[4]
[5]
,
、
、
有效特征
通常可将信号包络特征
高阶矩
[6]
[7]
时频特征 以及模糊函数特征 等参数作为辐射源
。
的个体特征 这些特征均需基于先验知识人工提取
,
1. 2
辐射源包络提取
设窄带接收机侦收辐射源基带信号为
其包络可描述为
a( n) = | s( n) | + | Hilbert[s( n) ]| , ( 1)
,
因而所提取特征未必能描述辐射源的本质特点 且人
s( n) ,
则
,
工提取特征过程繁琐 使得数据库更新缓慢
。
,
近年来 深度神经网络的兴起使得机器自动提
2
2
槡
,
取特征成为现实 深度神经网络可逼近复杂的非线
: Hilbert[·]
为希尔伯特变换
。
a( n)
对 进行滑
式中
, ,
性函数 具有较强的泛化能力 能够刻画数据本质信
,
动平均处理可获得平滑的包络曲线 以上升沿中点
[8]
,
( FPGA) 、
图形处理单元
息
且现场可编程门阵列
,
对齐信号包络 可截取一段包络前沿作为深度神经
( GPU)
的加速处理方法使得运算的实时性得以保
。
2
给出了两类雷达个体辐射源包络
网络的输入
图
。
,
基于此 本文提出了一种深度强化学习的辐射
证
, 2
前沿 图 中每类辐射源有
10
,
个样本 接收机带宽
,
源个体识别方法 利用不同雷达个体发射信号包络
200 MHz,
采样频率为
1 GHz, SNR 15 dB.
信噪比 ≥
为
, ,
的差异实现辐射源识别 在实际电子对抗环境中 雷
2 , 、
从图 中可以看出 两类辐射源包络上升沿形状 过
,
达辐射源脉冲宽度从微秒级到毫秒级变化 这种大
,
冲点均存在差异 表明不同辐射源个体可通过包络
范围的脉宽变化使得处理整个辐射源包络较为困
。
前沿区分开来
, ,
难 考虑到工程应用中系统的实时性要求 本文将辐
(
射源包络前沿 包络上升沿及其前后部分数据
)
作
。
为个体特征进行辐射源识别
1
辐射源包络
1. 1
辐射源侦收
1
,
给出了一种电子侦察设备个体识别框图
图
、
为了兼顾宽带接收机侦察范围大 窄带接收机灵敏
2
图
两类雷达个体辐射源包络前沿
Fig. 2 Envelope rising edges of different
radar emitter individuals
, 、
度高的优点 本文采用一种宽带 窄带接收机并行工
。
作的方案 宽带接收机对信道带宽进行子信道划
,
分 进而完成各频段辐射源信号的检测与参数估计
( PDW)
;
样本集 窄带接收机
以获取宽带脉冲描述字
2
深度强化学习
,
分时侦收各频段辐射源信号 对射频前端中频输出
2. 1
马尔可夫决策过程
C
讨论强化学习模型在 类已知辐射源识别问
、
PDW
样本集经数据融合后再对
。
进行采样 信号检测及参数估计以获取窄带
; 、
样本集 宽带 窄带
PDW
。
题中的应用 强化学习任务通常用马尔可夫决策过
其融合结果进行信号分选 信号分选后的辐射源描
( MDP)
,MDP < S,A,p,r > ,
对应四元组
程
来描述
( EDW)
,
述字
将作为个体识别模块的控制信号 依据
s( n)
对
: S
其中 为输入状态集合
,s
S
;
∈
为某个特定状态
PDW
窄带
样本集选择感兴趣的辐射源脉冲
A ,a A ; p
为可选动作集合 ∈ 为某个特定动作 为当前
, n
其进行个体识别 其中 为离散时间
。
全部评论(0)