- 1
- 2
- 3
- 4
- 5
基于n-gram频率的语种识别改进方法
资料介绍
识别短文本的语言种类是社交媒体中自然语言处理的重要前提,也是一个挑战性热点课题.由于存在集外词和不同语种相同词汇干扰的问题,传统基于n-gram的短文本语种识别方法 (如Textcat、LIGA、log LIGA等)识别效果在不同的数据集上相差甚远,鲁棒性较差.本文提出了一种基于n-gram频率语种识别改进方法,根据训练数据不同特性,自动确定语言中特征词和共有词的权重,增强语种识别模型在不同数据集上的鲁棒性.实验结果证明了该方法的有效性.
部分文件列表
文件名 | 大小 |
基于n-gram频率的语种识别改进方法.pdf | 621K |
最新上传
-
21ic下载 打赏310.00元 1小时前
用户:w178191520
-
21ic下载 打赏310.00元 1小时前
用户:小猫做电路
-
21ic下载 打赏310.00元 1小时前
用户:zhengdai
-
21ic下载 打赏210.00元 1小时前
用户:gsy幸运
-
21ic下载 打赏230.00元 1小时前
用户:jh0355
-
21ic下载 打赏260.00元 1小时前
用户:xzxbybd
-
21ic下载 打赏70.00元 1小时前
用户:jh03551
-
21ic下载 打赏60.00元 1小时前
用户:sun2152
-
21ic下载 打赏80.00元 1小时前
用户:铁蛋锅
-
21ic下载 打赏60.00元 2小时前
用户:xuzhen1
-
21ic下载 打赏60.00元 2小时前
用户:liqiang9090
-
21ic下载 打赏30.00元 2小时前
用户:wangcunxia
-
21ic下载 打赏20.00元 2小时前
用户:玉落彼岸
-
21ic下载 打赏15.00元 2小时前
用户:kk1957135547
-
21ic下载 打赏15.00元 2小时前
用户:w993263495
-
21ic下载 打赏15.00元 2小时前
用户:x15580286248
-
21ic下载 打赏15.00元 2小时前
用户:w1966891335
-
21ic下载 打赏15.00元 2小时前
用户:hp860629
-
21ic下载 打赏10.00元 2小时前
用户:staven630
-
21ic下载 打赏10.00元 2小时前
用户:我觉得八行
-
21ic下载 打赏10.00元 2小时前
用户:曾多次
-
21ic下载 打赏10.00元 2小时前
用户:272586851
-
21ic下载 打赏10.00元 2小时前
用户:熄欲
-
SYFSSYYFF 打赏3.00元 3天前
-
我是蒙帆 打赏1.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic下载 打赏310.00元 3天前
用户:w178191520
-
21ic下载 打赏310.00元 3天前
用户:小猫做电路
-
21ic下载 打赏310.00元 3天前
用户:gsy幸运
-
21ic下载 打赏210.00元 3天前
用户:zhengdai
-
21ic下载 打赏210.00元 3天前
用户:jh0355
-
21ic下载 打赏210.00元 3天前
用户:jh03551
-
21ic下载 打赏210.00元 3天前
用户:xzxbybd
-
21ic下载 打赏70.00元 3天前
用户:铁蛋锅
-
21ic下载 打赏60.00元 3天前
用户:sun2152
-
21ic下载 打赏60.00元 3天前
用户:xuzhen1
-
21ic下载 打赏60.00元 3天前
用户:liqiang9090
全部评论(0)