推荐星级:
- 1
- 2
- 3
- 4
- 5
基于FTVGG16卷积神经网络的鱼类识别方法
资料介绍
针对大多数应用场景中,大多数鱼类呈不规则条状,鱼类目标小,受他物遮挡和光线干扰,且一些基于颜色、形状、纹理特征的传统鱼类识别方法在提取图像特征方面存在计算复杂、特征提取具有盲目和不确定性,最终导致识别准确率低、分类效果差等问题,本文在分析已有的VGG16卷积神经网络良好的图像特征提取器的基础上,使用Image Net大规模数据集上预训练的VGG16权重作为新模型的初始化权重,通过增加批规范层(Batch normalization,BN)、池化层、Dropout层、全连接层(Fully connected,FC)、softmax层,采用带有约束的正则权重项作为模型的损失函数,并使用Adam优化算法对模型的参数进行更新,汲取深度学习中迁移学习理论,构建了FTVGG16卷积神经网络(Fine-tuning VGG16 convolutional neural network,FTVGG16)。测试结果表明:FTVGG16模型在很大程度上能够克服训练的过拟合,收敛速度明显加快,训练时间明显减少,针对鱼类目标很小、背景干扰很强的图像,FTVGG16模型平均准确率为97. 66%,对部分鱼的平均识别准确率达到了99. 43%。
部分文件列表
文件名 | 大小 |
基于FTVGG16卷积神经网络的鱼类识别方法.pdf | 3M |
部分页面预览
(完整内容请下载后查看)2 0 1 9
5
农 业 机 械 学 报
50
5
卷 第 期
年
月
第
doi: 10. 6041 /j. issn. 1000-1298. 2019. 05. 026
FTVGG16
基于
卷积神经网络的鱼类识别方法
1,2
1,3
1,3
1,3
陈英义
龚川洋
刘烨琦
方晓敏
( 1.
,
中国农业大学信息与电气工程学院 北京
100083; 2.
,
农业农村部信息获取技术重点实验室 北京
100083;
3.
,
北京农业物联网工程技术研究中心 北京
100083)
: , , , ,
摘要 针对大多数应用场景中 大多数鱼类呈不规则条状 鱼类目标小 受他物遮挡和光线干扰 且一些基于颜色
、
、 、 ,
形状 纹理特征的传统鱼类识别方法在提取图像特征方面存在计算复杂 特征提取具有盲目和不确定性 最终导致
、 ,
识别准确率低 分类效果差等问题 本文在分析已有的
VGG16
,
卷积神经网络良好的图像特征提取器的基础上 使
ImageNet VGG16
大规模 数 据 集 上 预 训 练 的
,
权 重 作 为 新 模 型 的 初 始 化 权 重 通 过 增 加 批 规 范 层
( Batch
用
normalization,BN) 、
池化层
、Dropout
、
层 全连接层
( Fully connected,FC) 、softmax
,
层 采用带有约束的正则权重项作
,
为模型的损失函数 并使用
Adam
,
,
优化算法对模型的参数进行更新 汲取深度学习中迁移学习理论 构建了
: FTVGG16
模
FTVGG16 ( Fine-tuning VGG16 convolutional neural network,FTVGG16) 。
卷积神经网络
测试结果表明
, , , 、
型在很大程度上能够克服训练的过拟合 收敛速度明显加快 训练时间明显减少 针对鱼类目标很小 背景干扰很
,FTVGG16
97. 66% , 99. 43% 。
对部分鱼的平均识别准确率达到了
强的图像
模型平均准确率为
: ; ; ;
关键词 鱼类识别 卷积神经网络 迁移学习 模式识别
: TP391 : A : 1000-1298( 2019) 05-0223-09
文献标识码 文章编号
中图分类号
Fish Identification Method Based on FTVGG16 Convolutional Neural Network
1,2
1,3
1,3
1,3
CHEN Yingyi
GONG Chuanyang
LIU Yeqi
FANG Xiaomin
( 1. College of Information and Electrical Engineering,China Agricultural University,Beijing 100083,China
2. Key Laboratory of Agricultural Information Acquisition Technology,Ministry of Agriculture and Rural Affairs,Beijing 100083,China
3. Beijing Engineering and Technology Research Center for Internet of Things in Agriculture,Beijing 100083,China)
Abstract: Computer vision technology is widely applied in fish individual identification. Nevertheless,
there are some problems such as small fish targets,occlusion of objects and light interference in videos
and images. Some fish identification methods based on color,shape and texture also exit complicated
calculations in feature extraction,such as non-migration of features will result in low recognition accuracy
and poor classification. With the help of analysis of image feature extraction of the existing VGG16
convolutional neural network model,the FTVGG16 convolutional neural network ( Fine-tuning VGG16
convolutional neural network) was designed. As it was known,the basic deep learning tool used in this
work was convolutional neural networks. The FTVGG16 convolutional neural network was composed of
convolutional layers,batch normalization layers,pooling layers,Dropout layers,fully connected layers
and softmax layers. The experimental results showed that the average recognition accuracy of the
FTVGG16 model for fish was about 97. 66% ,and the average recognition rate of some fishes could reach
99. 43% . It had high recognition accuracy and robustness in pictures with small fish targets and strong
background interference. It could be operated through an appropriate,easy-to-use,and user-friendly web
application for the specific case of fish identification.
Key words: fish identification; convolutional neural network; transfer learning; pattern recognition
, , ,
点 多年来 许多学者对其进行了深入研究 尤其是
0
引言
、 、
基于颜色 形状 纹理等图像内容的鱼类识别研究较
[1]
,
多 并取得了较大进展
。STRACHAN
等
鱼类的计算机视觉识别一直是该领域的研究热
利用鱼的
: 2018-10-30
: 2018-12-27
修回日期
收稿日期
:
基金项目 国家重点研发计划项目
( 2017YFE0122100)
( Z171100001517016)
和北京市科技计划项目
:
作者简介 陈英义
( 1980—) , , , , ,E-mail: chengyingyi@ cau. edu. cn
男 教授 博士生导师 主要从事农业模型和信息处理技术研究
224
2 0 1 9
年
农
业
机
械
学
报
[2]
。LARSEN
。
形状进行分类
等
使用线性判别分析方
速的鱼类识别系统提供理论基础
( Latent dirichlet allocation,LDA)
法
对鱼种形状和纹
1
材料与方法
[3]
,
理特征进行分类 准确率为
76% 。HUANG
等
提
BGOT( Balance guaranteed optimized tree)
,
算法 对
1. 1
出
图像获取
图像数据来自大自然保护协会提供的远洋捕捞
10
3 179 ,
幅图像数据进行分类 准确
采集的
个鱼种
吴一全等 提出基于最小二乘支持向
( Least squares support vector machine,LSSVM)
[4]
[17]
95% 。
。
3 777
幅
率为
量机
船上摄像头拍摄的场景
该协会提供了
1 000
带标注的鱼类图像和
幅不带标注的鱼类图
[5]
,
95. 83%
。
。
1 , 8
部分海鱼类图像示例如图 所示 图像包含 类
的识别方法 准确率为
提出了基于支持向量机
SVM)
以上 杜伟东等
( Support vector machine,
90%
像
, 7 ( ) 1
目标 其中 类是不同种类的海鱼 目标 和 类不
,
,
,
的决策融合鱼类识别方法 准确率在
以
包括鱼类目标的背景 每幅图像只属于某一类别 构
FTVGG16
建的 模型需要识别出每幅图像中包含的
鱼类目标
1. 2
。
上
, ,
但是 随着机器视觉技术的发展 数据量剧增
,
。
基于内容的识别方法在特征提取方面存在的计算复
图像预处理
[6]
、 。
杂 特征不可迁移性 等问题愈发突出 特别是对
,
在深度学习领域 通过对图像进行预处理可以
、 、
图像中存在目标小 他物遮挡 光线干扰等情况的图
, 。
增强数据样本 进而提高模型性能 本文图像预处
,
像识别上 存在识别准确率低或运算效率低等问题
,
:
理主要包括
( 1)
[7]
。
不能满足实际需求 深度学习 中卷积 神 经 网
,
图像像素值处理 即将
JPG
格式的图像转
[8,11]
( Convolutional neural network,CNN)
RGB
。
三通道的矩阵向量存储 映射图像像素
络
的出现
换为
[8 - 9]
[10]
、
[0,255] [0,1],
值从 到 这样处理可以使模型在使用
已经彻底改变了图像识别
数据处理在农业中的应用方式 刘德营等 提出
了一种基于卷积神经网络的白背飞虱自动识别方
语音识别 以及大
[12]
。
, “ ”
激活函数时 避免神经元进入 死区 而导致神经元
,
。
失活 最终使卷积神经网络获得比较快的收敛速度
( 2) ,
图像空间尺度变换 即将图像进行随机缩
[13]
[14]
;
法 傅隆生等 提出了一种基于
Let-Net5
卷积神
、 、 、 、
放 平移 旋转 镜像 随机裁剪
。
经网络的田间多簇猕猴桃果实图像识别深度学习模
[15]
;
型 王璨等 提出了一种基于卷积神经网络提取多
( 3)
, 。
图像均值与方差均衡 即样本归一化 图
,
尺度分层特征的田间玉米杂草识别方法 为本研究
2 。
像预处理的结果示例如图 所示 预处理后图像尺
。
600 × 600
。
像素
的开展提供了新思路
,
本文在上述研究成果的基础上 通过分析已有
寸为
1. 3
像素
试验方法设计
模型训练采用的环境是
[16]
VGG16
Ubuntu 16. 04LTS
的
卷积神经网络模型良好的图像特征提
FTVGG16
操作
,
取功能 设计
,
卷积神经网络 提高复杂应
、 16GB、NVIDIA 1080 Ti
系统 运行内存为 显卡
GPU、
[18]
[19]
, 、 、
用场景鱼类目标的识别精度 为构建可靠 精准 快
CUDA
,Keras
编程平台
并行
的深度学习框架
1
图
鱼类图像样本
Fig. 1 Fish image samples
全部评论(0)