推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于词性与词序的相关因子训练的 word2vec改进模型

更新时间:2019-12-24 14:10:28 大小:2M 上传用户:守着阳光1985查看TA发布的资源 标签:词性 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

词性是自然语言处理的基本要素,词语顺序包含了所传达的语义与语法信息,它们都是自然语言中的关键信息.在word embedding模型中如何有效地将两者结合起来,是目前研究的重点.本文提出的Structured word2vec on POS联合了词语顺序与词性两种信息,不仅使模型可以感知词语位置顺序,而且利用词性关联信息来建立上下文窗口内词语之间的固有句法关系.Structured word2vec on POS将词语按其位置顺序定向嵌入,对词向量和词性相关加权矩阵进行联合优化.实验通过词语类比、词相似性任务,证明了所提出的方法的有效性.


部分文件列表

文件名 大小
基于词性与词序的相关因子训练的_word2vec改进模型.pdf 2M

部分页面预览

(完整内容请下载后查看)
8
Vol. 46 No. 8  
Aug. 2018  
2018  
8
ACTA ELECTRONICA SINICA  
基于训练的  
word2vec  
型  
1
1
1
2
1
, , , ,  
潘 博 于重重 青川 徐世璇 曹 帅  
( 1.  
北京工大学计算机与信息工程学院 北京  
100048; 2.  
中国北京科学院学与人类学研究北京  
100081)  
:
, ,  
自然语言理的基本要语顺传达法信息 自然语言中的  
信息 在  
word embedding . Structured word2vec  
如何有效地研究的重点 本文提出的  
on POS  
, ,  
语顺种信息 使关联信息建立文  
. Structured word2vec on POS  
将词定向向量加  
窗口法关系  
,  
矩阵进行合优化 实验通过提出的方法的有效性  
:
word embedding; ; word2vec  
; ;  
序  
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
:
TP3-0  
:
A
:
文章编号  
0372-2112 ( 2018) 08-1976-07  
文献标识码  
DOI: 10. 3969 /j. issn. 0372-2112. 2018. 08. 024  
电子学报  
The Improved Model for word2vec Based on  
Part of Speech and Word Order  
1
1
1
2
1
PAN Bo YU Chong-chong ZHANG Qing-chuan XU Shi-xuan CAO Shuai  
( 1. Department of Computer and Information EngineeringBeijing Technology and Business UniversityBeijing 100048China;  
2. Academy of Social SciencesInstitute of Ethnology and AnthropologyBeijing 100081China)  
Abstract: Part of speech( POS) is the basic element of Natural Language Processing( NLP) word order consists of  
its conveyed semantic and syntax informationboth are the key information of language. There is still lack of such a word  
embedding model that combines the two together as the influential element. This paper presents the Structured Word2vec on  
POS that linked the two information of word order and POS togethernot only enables the model to sense the words position  
and orderbut alsouse the POS information to establish the inherent syntactic relation between words in the context window.  
Structured Word2vec on POS is capable to directionally embed the words into context window according to their position,  
and optimizes the word vector and POSrelevance weight matrix. Experiment through word analogyword similarity task  
proved the effectiveness of our method.  
Key words: word embedding; part of speech; relevance weights; word order; word2vec  
效果限  
1
引言  
Bengio  
( Neural  
提 出 网 络 语 言 型  
年  
10]  
语言义向量用实向量示每语  
Network Language ModelNNLM)  
研究们  
的关与重研究其应用于自然语言领  
: ( Recurrent Neural Net-  
型  
1]  
向量可作为应用中的特征 分类  
2]  
3]  
4]  
实体识别 解析  
1112]  
5]  
workslanguage modelRNNLM)  
. NNLM  
RNNLM  
评估法 中 的基于阵  
78]  
结构过复杂 线隐层带  
( Matrix Factorization)  
解  
型  
显示出其  
13]  
的 计 问 题  
Mikolov  
提 出 了  
:
传达共  
9]  
word2vec  
: Continuous Bag-of-  
线 型  
Words Model( CBOW) Continuous Skip-gram( CSG) .  
点  
Lebret  
Collobert  
提出以  
Hellinger PCA( HPCA)  
式进行提  
: 2017-04-18;  
: 2017-08-23;  
:
收稿日期  
修回日期  
基金项目 部人文科学研究与规划基金  
( No. KZ201410011014)  
责任编辑 蓝红杰  
:
( No. 16YJAZH072) ;  
( No. 14ZDB156) ;  
B
北京自然基金重点项目 类  
国家科学基金重大项目  
1977  
8
: word2vec  
博 基于训练型  
14]  
CBOW  
CSG  
Kavukcuoglu  
线结构上  
人  
人 提出基于  
explicit word embeddings . Jeffrey  
15]  
vLBL  
ivLBL. Levy  
提出了似模型  
PPMI  
的  
型  
16]  
2014  
提出了一种基于全信息的示  
GloVe ,  
建立  
word-word  
共现矩阵 而  
型  
矩阵进行优化  
Word2vec GloVe  
: ( 1)  
于  
型不足之处于  
( 2)  
关联信息 针  
语顺信息感  
问题中  
Structured word2vec  
17]  
: Wang  
人 提出定  
有效语顺序  
; Liu  
入模型  
信息 大提高关任效果  
18]  
( POS Relevance  
通 过 入 词 重  
人  
Weights) ,  
关联信息进行建模  
17]  
18]  
Wang  
Liu  
p( u| context( word( t) ) ) = ( x  
σ
·O( u) )  
本文主要基于  
的方法  
word( t)  
u
Structured word2vec on POS( SWP)  
型 该型不  
提出  
语顺关联  
信息窗口法关进行建  
. .  
=
(
( v( word( t + i) ) ) · ( i) ) )  
θ
( 1)  
σ
-c  
i ci 0  
≤ ≤ ≠  
17]  
2. 2 SSG  
SSG  
CSG  
给定 的  
于  
:
实验任  
|
V | × d  
word( t)  
O
R
使用单个矩阵  
下  
序较敏  
c × 2  
本文提出型比先进的  
word embedding  
结构图  
2. CSGSSG  
相比于  
效果更好  
|
V | × d  
用  
O
R
定义组  
矩阵  
矩阵专用中  
2
 
O
O O O  
1
c  
- 1  
c  
测  
p( word( t) | word  
CWindowSSG  
PWE  
word  
结构的  
对  
embedding  
( t + 2) )  
型以  
O
word( t + 2)  
矩阵 为  
2
关工作进行顾  
O ( word( t + 2) ) .  
2
17]  
得到输测向量  
2. 1 CWindow  
CWindow  
CBOW  
基于  
进 它定义不同  
1.  
结构图  
|
V | × 2cd  
O
R
矩阵  
按照联的  
=v( word( t c) ) v( word( t - 1) ) v( word( t  
影层中  
2c × d  
向量  
x
word( t)  
+ 1) ) v( word( t + c) ) .  
并将到输因  
O
矩阵 定义用参数  
19]  
Collobert  
描述的基于窗口型  
型参照  
在进行将词向量窗口  
CWindow NS  
u
述  
语  
共现如 公 式  
( word( t)  
context ( word ( t) )  
文  
( 1) .  
u  
语  
正样本 其为  
u
) ( i)  
O( u)  
d
本  
θ
从  
向量 其随着输入定向变化  
的一为  
SSG  
NS  
word( t + i)  
法中 本  
所述  
i
u
u
共现如下  
:
( i)  
x
v( word( t + i) )  
对应向量  
θ
进行内相  
O( u) ) 1 ~ d  
中第  
word( t)  
word( t + i)  
u
u
{ word( t) } Neg  
( word( t) )  
, ( c) = O( u) 1 ~ d]  
θ 示  
( 2)  
u
p( word( t + i) | u) = ( v( word( t + i) ) ·O ( u) )  
σ
i
, ( c)  
向量 θ  
word( t c)  
测向量 因此  
对应是  
18]  
u
2. 3 PWE  
v( word( t c) )  
( c)  
进行内乘  
θ  
PWE  
CBOW  
进行进 通过相  
c + i + 1i c- 1]  
基于  
indexi=  
{
Context( word( t) )  
S
c + ii 1c]  
矩阵来为 进行建模 于  
= { word( 1) word( N) } word  
语  
u
{ word( t) } Neg( word( t) )  
u
( i)  
z ,  
标记标记 词 词被  
i
( i) = O( u) ( indexi- 1) × d + 1 ~ indexi× d]  
θ

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载