您现在的位置是：首页 > 技术资料 > 一种深度强化学习的雷达辐射源个体识别方法

推荐星级：

一种深度强化学习的雷达辐射源个体识别方法

更新时间：2020-01-02 08:33:25 大小：2M 上传用户：songhuahua 查看TA发布的资源 标签：深度强化学习雷达 下载积分：1分评价赚积分（如何评价?）收藏评论(0) 举报

资料介绍

针对传统依赖于人工经验提取辐射源个体特征的不足,提出一种基于深度强化学习的雷达辐射源个体识别方法。利用发射机非理想信道造成的辐射源信号包络在信号变化时呈现的不同瞬态信息,以信号包络前沿作为深度神经网络的输入状态,以辐射源类别作为当前输入状态的可选动作,通过卷积神经网络自动提取辐射源包络个体特征,并拟合当前状态动作对的Q值,进而以强化学习模型完成雷达辐射源个体识别任务。讨论了深度Q网络模型、深度双Q网络模型以及Dueling Network模型3种深度强化学习模型在辐射源识别任务中的应用。实测数据仿真实验表明:传统机器学习算法的识别率不足80%,而深度强化学习网络的识别率高达98. 42%.

部分文件列表

文件名	大小
一种深度强化学习的雷达辐射源个体识别方法.pdf	2M

立即下载

【关注视频号领20积分】【关注公众号立即送20积分】

部分页面预览

（完整内容请下载后查看）

Vol． 39 No． 12

Dec． 2018

第

卷第

期

兵

工

学

报

2 0 1 8

ACTA ARMAMENTARII

年

月

一种深度强化学习的雷达辐射源个体识别方法

，

冷鹏飞徐朝阳

(

723

，

研究所江苏扬州

225001)

中国船舶重工集团有限公司第

: ，

摘要针对传统依赖于人工经验提取辐射源个体特征的不足提出一种基于深度强化学习的

。

雷达辐射源个体识别方法利用发射机非理想信道造成的辐射源信号包络在信号变化时呈现的不

，，

同瞬态信息以信号包络前沿作为深度神经网络的输入状态以辐射源类别作为当前输入状态的可

，， Q ，

选动作通过卷积神经网络自动提取辐射源包络个体特征并拟合当前状态动作对的值进而以

。 Q 、 Q

强化学习模型完成雷达辐射源个体识别任务讨论了深度网络模型深度双网络模型以及

Dueling Network

3 。

模型种深度强化学习模型在辐射源识别任务中的应用实测数据仿真实验表

明传统机器学习算法的识别率不足

80% ，

而深度强化学习网络的识别率高达

98. 42% ．

: ; ; ;

关键词雷达辐射源个体识别深度神经网络强化学习

: TN971 . 1

: A

: 1000-1093( 2018) 12-2420-07

文章编号

中图分类号

文献标志码

DOI: 10． 3969 /j． issn． 1000-1093． 2018． 12． 016

Specific Emitter Identification Based on Deep Reinforcement Learning

LENG Peng-fei，XU Chao-yang

( No． 723 Institute，China Shipbuilding Industry Corporation，Yangzhou 225001，Jiangsu，China)

Abstract: A specific emitter identification ( SEI) method based on deep reinforcement learning is pro-

posed on account of the deficiency of emitter individual feature extraction depending on artificial experi-

ence． Due to the differences of the transient information of signal envelope，which results from the change

of the signal owing to a nonideal transmitter channel，an envelope rising edge is used as the input state of

deep neural network，and the emitter classifications are used as the optional actions of the current input

state． The envelope features are extracted automatically through the convolutional neural network

( CNN) ，and Q values of the current state action pairs are fitted，thus completing the specific emitter i-

dentification task based on the reinforcement learning model． The applications of deep Q network

( DQN) ，deep double Q network ( DDQN) and Dueling network in the specific emitter identification are

discussed． The measured results show that the recognition rate of traditional machine learning algorithm is

less than 80% ，but the deep reinforcement learning model can achieve the high recognition rate of

98. 42% ．

Key words: radar; specific emitter identification; deep neural network; reinforcement learning

: 2018-05-07

收稿日期

( 2016

)

年

基金项目装备预研船舶重工联合基金项目

( 1994—) ，。E-mail: ttl_eye@ 163． com

硕士研究生

，

作者简介冷鹏飞

男

通信作者徐朝阳

( 1968—) ，

，，

研究员硕士生导师

。E-mail: edaxcy@ vip． sina． com

男

2421

第

期

一种深度强化学习的雷达辐射源个体识别方法

引言

，

在雷达对抗领域中雷达辐射源识别技术是电

，

子对抗情报分析领域中的重要研究内容其水平是

衡量电子侦察系统和侦察设备信息处理技术先进程

［1］

。

度的重要标志

雷达辐射源个体识别技术通过

［2］

，

当前雷

脉内无意调制特征区分雷达的不同个体

达辐射源识别问题的一个研究热点为提取辐射源的

图

一种电子侦察设备个体识别框图

Fig． 1 Block diagram of specific emitter identification of

electronic reconnaissance equipment

［3］

［4］

［5］

，

、

有效特征

通常可将信号包络特征

高阶矩

［6］

［7］

时频特征以及模糊函数特征等参数作为辐射源

。

的个体特征这些特征均需基于先验知识人工提取

，

1. 2

辐射源包络提取

设窄带接收机侦收辐射源基带信号为

其包络可描述为

a( n) = | s( n) | + | Hilbert［s( n) ］| ， ( 1)

，

因而所提取特征未必能描述辐射源的本质特点且人

s( n) ，

则

，

工提取特征过程繁琐使得数据库更新缓慢

。

，

近年来深度神经网络的兴起使得机器自动提

槡

，

取特征成为现实深度神经网络可逼近复杂的非线

: Hilbert［·］

为希尔伯特变换

。

a( n)

对进行滑

式中

，，

性函数具有较强的泛化能力能够刻画数据本质信

，

动平均处理可获得平滑的包络曲线以上升沿中点

［8］

，

( FPGA) 、

图形处理单元

息

且现场可编程门阵列

，

对齐信号包络可截取一段包络前沿作为深度神经

( GPU)

的加速处理方法使得运算的实时性得以保

。

给出了两类雷达个体辐射源包络

网络的输入

图

。

，

基于此本文提出了一种深度强化学习的辐射

证

， 2

前沿图中每类辐射源有

，

个样本接收机带宽

，

源个体识别方法利用不同雷达个体发射信号包络

200 MHz，

采样频率为

1 GHz， SNR 15 dB．

信噪比 ≥

为

，，

的差异实现辐射源识别在实际电子对抗环境中雷

2 ，、

从图中可以看出两类辐射源包络上升沿形状过

，

达辐射源脉冲宽度从微秒级到毫秒级变化这种大

，

冲点均存在差异表明不同辐射源个体可通过包络

范围的脉宽变化使得处理整个辐射源包络较为困

。

前沿区分开来

，，

难考虑到工程应用中系统的实时性要求本文将辐

(

射源包络前沿包络上升沿及其前后部分数据

)

作

。

为个体特征进行辐射源识别

辐射源包络

1. 1

辐射源侦收

，

给出了一种电子侦察设备个体识别框图

图

、

为了兼顾宽带接收机侦察范围大窄带接收机灵敏

图

两类雷达个体辐射源包络前沿

Fig． 2 Envelope rising edges of different

radar emitter individuals

，、

度高的优点本文采用一种宽带窄带接收机并行工

。

作的方案宽带接收机对信道带宽进行子信道划

，

分进而完成各频段辐射源信号的检测与参数估计

( PDW)

;

样本集窄带接收机

以获取宽带脉冲描述字

深度强化学习

，

分时侦收各频段辐射源信号对射频前端中频输出

2. 1

马尔可夫决策过程

讨论强化学习模型在类已知辐射源识别问

、

PDW

样本集经数据融合后再对

。

进行采样信号检测及参数估计以获取窄带

; 、

样本集宽带窄带

PDW

。

题中的应用强化学习任务通常用马尔可夫决策过

其融合结果进行信号分选信号分选后的辐射源描

( MDP)

，MDP ＜ S，A，p，r ＞，

对应四元组

程

来描述

( EDW)

，

述字

将作为个体识别模块的控制信号依据

s( n)

对

: S

其中为输入状态集合

，s

;

∈

为某个特定状态

PDW

窄带

样本集选择感兴趣的辐射源脉冲

A ，a A ; p

为可选动作集合 ∈ 为某个特定动作为当前

， n

其进行个体识别其中为离散时间

。

全部评论(0)

暂无评论

评论赚积分>>

上传资源

一种深度强化学习的雷达辐射源个体识别方法

资料介绍

部分文件列表

部分页面预览

相关下载

全部评论(0)

热门标签

最新上传

热门下载

推荐下载

专栏首页