Vol. 50 No. 11
Nov. 2018
50
11
期
第
卷
第
哈
尔
滨
工
业
大
学
学
报
2 0 1 8
11
月
年
JOURNAL OF HARBIN INSTITUTE OF TECHNOLOGY
j.issn.
DOI: 10.11918/
0367-6234.201709078
一种结合深度学习和集成学习的情感分析模型
, ,
金志刚 韩 玥 朱 琦
(
,
天津大学 电气自动化与信息工程学院 天津
300072)
: , . ,
要 随着社交媒体的不断发展 用户评价已成为网络决策的关键因素 为了准确分析社交媒体用户评价的情感倾向性 更
摘
-
、
,
Bi LSTM
Bagging
,
—
好地推进舆情分析 推荐算法等工作 本文通过对
模型和
-
模型 该模型的特点在于将深度学习模型可提取抽象特征的优势和集成学习多分类器共同决策的思想相结合
算法的改进 提出了一种新的情感分析模型
-
Bi LSTMM B
.
.
-
Bi LSTM
-
Bi LSTMM
Maxout
,
神经元 构建
,
模型 解决随机梯度下降算法中存在的梯度弥散问题
,
一方面在
模型的基础上引入
. ,
更好地优化训练过程 另一方面 模型基于
Bagging
,
算法训练多个情感分类器 根据分类器性能优劣利用袋外数据为每个分类
-
Bi LSTMM B
器分配指定类别的权重 并提出相应的改进投票策略 增强了模型的泛化能力 实验结果表明 本文提出的
-
,
,
.
:
模型
LSTM
12.08%,
其中
Maxout
8.28% ,
的相对改善效果 改进后
相比于传统的
的投票策略对准确率有
和集成学习思想相结合可提高情感分析的准确率 并具有一定的研究价值
模型准确率提高
神经元的引入对情感分析准确率有
4.06%
,
F
.
,
的相对改善效果 并在召回率和 值两项指标上均优于其他对比模型 由此证明 深度学习模型
,
.
-
; Bi LSTM
: ; ;
关键词 情感倾向性分析 深度学习 集成学习
; Maxout
; Bagging
神经元 算法
模型
-
-
-
: 0367 6234( 2018) 11 0032 08
文章编号
: TP391 : A
文献标志码
中图分类号
A sentiment analysis model with the combination of deep learning
and ensemble learning
JIN Zhigang,HAN Yue,ZHU Qi
( School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China)
Abstract: With the development of social media,users’evaluations have become a key factor in network decision
-
making. Owing to the necessity of making a more accurate analysis on the emotional tendency of social media
users’evaluations as well as promoting public opinion analysis and recommendation algorithms,a sentiment
- - -
analysis model called Bi LSTMM B ( Bi directional Long Short Term Memory Model with Maxout neurons in
Bagging algorithm) is proposed. With the feature of combining deep learning model and the idea of ensemble
- -
learning,the model improves the Bi LSTM model and the Bagging algorithm. On the one hand,the Bi LSTMM
-
model introduces the Maxout neural into the Bi LSTM model to solve the vanishing gradient problem during the
stochastic gradient descent training and optimize the training process. On the other hand,multiple emotional
classifiers were trained at the foundation of the Bagging algorithm. The out of bag data assigns the weight for each
classifier on specified category according to their performance. Hence the voting strategy is improved to enhance the
-
-
generalization ability of the model. The experimental results indicate that the accuracy of the Bi LSTMM B model
is improved by 12.08% compared to the traditional LSTM model. It is also superior to other contrast models in the
recall rate and F value. Therein,the introduction of Maxout neurons has a relative improvement effect of 8.28% on
the accuracy of sentiment analysis,while the improved voting strategy accounts for 4.06% on the accuracy. Thus,it
proves that combining deep learning and ensemble learning contributes to the improvement of the accuracy of
sentiment analysis,which shows some value in research.
-
Keywords: sentiment analysis; deep learning; ensemble learning; Bi LSTM model; Maxout neural; Bagging
algorithm
, ,
近年来 随着互联网技术的快速发展 各种各样
,
息载体 用户评价已成为人们进行网络决策时考虑
,
的社交媒体不断涌现 越来越多的用户通过社交媒
. , ,
的重要因素 情感倾向性分析 又称主客观分析 以
.
体平台表达自己的观点和想法 作为一种重要的信
,
挖掘文本信息中用户表达的情感极性为目标 其概
[1]
Nasukawa
. ,
提出 近年来 针对社交媒体
念最早由
- -
: 2017 09 14
收稿日期
用户评价的情感倾向性分析已成为自然语言处理领
:
基金项目 国家自然科学基金项目
( 71502125)
, .
域研究的热点问题之一 具有重要的研究价值 因
:
作者简介 金志刚
( 1972—) , , ,
男 教授 博士生导师
:
,zoomzq@ 163.com
琦
通信作者
朱
,
此 本文的研究目的是提出一种文本情感倾向性分
全部评论(0)