推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

一种深度强化学习的雷达辐射源个体识别方法

更新时间:2020-01-02 08:33:25 大小:2M 上传用户:songhuahua查看TA发布的资源 标签:深度强化学习雷达 下载积分:1分 评价赚积分 (如何评价?) 收藏 评论(0) 举报

资料介绍

针对传统依赖于人工经验提取辐射源个体特征的不足,提出一种基于深度强化学习的雷达辐射源个体识别方法。利用发射机非理想信道造成的辐射源信号包络在信号变化时呈现的不同瞬态信息,以信号包络前沿作为深度神经网络的输入状态,以辐射源类别作为当前输入状态的可选动作,通过卷积神经网络自动提取辐射源包络个体特征,并拟合当前状态动作对的Q值,进而以强化学习模型完成雷达辐射源个体识别任务。讨论了深度Q网络模型、深度双Q网络模型以及Dueling Network模型3种深度强化学习模型在辐射源识别任务中的应用。实测数据仿真实验表明:传统机器学习算法的识别率不足80%,而深度强化学习网络的识别率高达98. 42%.


部分文件列表

文件名 大小
一种深度强化学习的雷达辐射源个体识别方法.pdf 2M

部分页面预览

(完整内容请下载后查看)
39  
12  
Vol. 39 No. 12  
Dec. 2018  
卷第  
2 0 1 8  
12  
ACTA ARMAMENTARII  
一种深雷达辐源个方法  
冷鹏飞 徐朝阳  
(
723  
研究  
225001)  
中国重工有限第  
: ,  
摘要 传统人工源个体特征的提出一种基于学习的  
雷达辐源个方法 射机信号信号变化不  
, ,  
同瞬信息 信号沿为深网络入状当前入状可  
, , Q ,  
网络络个体特征 并拟当前对的 而以  
Q Q  
学习模型成雷达辐源个任务 讨论了网络模型 网络模型及  
Dueling Network  
3 。  
模型 种深学习模型任务的应用 数据仿实验表  
:
传统机器学习算法的足  
80% ,  
学习网络达  
98. 42% .  
: ; ; ;  
关键词 雷达 辐源个别 深网络 强学习  
+
: TN971 . 1  
: A  
: 1000-1093( 2018) 12-2420-07  
文章编号  
中图分类号  
文献标志码  
DOI: 10. 3969 /j. issn. 1000-1093. 2018. 12. 016  
Specific Emitter Identification Based on Deep Reinforcement Learning  
LENG Peng-feiXU Chao-yang  
( No. 723 InstituteChina Shipbuilding Industry CorporationYangzhou 225001JiangsuChina)  
Abstract: A specific emitter identification ( SEI) method based on deep reinforcement learning is pro-  
posed on account of the deficiency of emitter individual feature extraction depending on artificial experi-  
ence. Due to the differences of the transient information of signal envelopewhich results from the change  
of the signal owing to a nonideal transmitter channelan envelope rising edge is used as the input state of  
deep neural networkand the emitter classifications are used as the optional actions of the current input  
state. The envelope features are extracted automatically through the convolutional neural network  
( CNN) and Q values of the current state action pairs are fittedthus completing the specific emitter i-  
dentification task based on the reinforcement learning model. The applications of deep Q network  
( DQN) deep double Q network ( DDQN) and Dueling network in the specific emitter identification are  
discussed. The measured results show that the recognition rate of traditional machine learning algorithm is  
less than 80% but the deep reinforcement learning model can achieve the high recognition rate of  
98. 42% .  
Key words: radar; specific emitter identification; deep neural network; reinforcement learning  
: 2018-05-07  
收稿日期  
:
( 2016  
)
基金项目 重工联合基金项目  
( 1994—) , E-mail: ttl_eye@ 163. com  
士研究生  
:
作者简介 飞  
:
通信作者  
( 1968—) ,  
, ,  
研究员 士生导师  
E-mail: edaxcy@ vip. sina. com  
12  
2421  
深度识别方法  
0
引言  
识别技术是电  
中的重要研究是  
衡量系统备信息理技术程  
1]  
度的重要标  
识别技术通过  
2]  
雷  
的不体  
识别问题的一研究的  
1
识别图  
Fig. 1 Block diagram of specific emitter identification of  
electronic reconnaissance equipment  
3]  
4]  
5]  
征  
可将征  
矩  
6]  
7]  
以及参数源  
知识人取  
1. 2  
源包提取  
带信为  
可描述为  
a( n) = | s( n) | + | Hilberts( n) | , ( 1)  
描述本质人  
s( n) ,  
繁琐 使得数慢  
深度使得器自动提  
2
2
成为现实 深度非线  
: Hilbert·]  
换  
a( n)  
对 进行滑  
中  
, ,  
具有较能力 能据本质信  
线 沿中点  
8]  
( FPGA) 、  
元  
且现列  
可截沿深度经  
( GPU)  
加速方法使得的实保  
2
络  
入  
本文深度射  
2  
沿 有  
10  
宽  
识别方法 发射络  
200 MHz,  
为  
1 GHzSNR 15 dB.  
≥  
, ,  
差异识别 雷  
2 、  
出 两沿过  
源脉冲大  
在差异 表体可通过络  
范围使得整个较为困  
沿区来  
, ,  
考虑工程应用系统的实本文辐  
(
沿 沿及其前据  
)
进行识别  
1
源包  
1. 1  
源侦收  
1
识别图  
范围敏  
2
沿  
Fig. 2 Envelope rising edges of different  
radar emitter individuals  
、  
本文采用工  
案 宽进行道划  
源信参数计  
( PDW)  
;
机  
带脉冲描述字  
2
习  
源信出  
2. 1  
马尔可夫决策过程  
C
讨论型在 识别问  
PDW  
对  
进行参数带  
; 、  
带  
PDW  
中的应用 常用马尔过  
进行分选 分选描  
( MDP)  
MDP < SApr ,  
组  
描述  
( EDW)  
字  
识别制信据  
s( n)  
: S  
合  
s  
S
;
态  
PDW  
带  
源脉冲  
A a A ; p  
某个定动前  
n  
进行识别 为离间  

全部评论(0)

暂无评论