推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

一种融合用户关系的自适应微博话题跟踪方法

更新时间:2019-12-24 06:22:34 大小:2M 上传用户:zhiyao6查看TA发布的资源 标签:自适应微博话题跟踪 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

针对微博口语化、文本短小等特点以及现有研究的不足,本文提出了一种融合用户关系的自适应微博话题跟踪方法.首先,在当前跟踪的时间窗内,推文被映射到特征空间,并作为候选推文集合.然后,针对推文的分布特点以及话题跟踪的目的,变换推文特征空间.在此基础上,利用改进的K-means聚类算法对候选推文集合进行二元聚类,从而划分出相关推文集合,即当前话题目标模型.本文通过Twitter平台获取数据进行实验,实验结果表明,该方法能够实时地跟踪话题热度的变化以及焦点的演变,并提高了微博中话题跟踪的稳定性.该方法为用户推荐、舆情分析等领域提供了有效的支撑.


部分文件列表

文件名 大小
一种融合用户关系的自适应微博话题跟踪方法.pdf 2M

部分页面预览

(完整内容请下载后查看)
6
Vol. 45 No. 6  
Jun. 2017  
2017  
6
ACTA ELECTRONICA SINICA  
户关系的  
适应  
12  
1
1
3
, , ,  
柏文言 付 张志明  
( 1.  
国科学工程研究北京  
100093; 2.  
北京电大学计北京  
100876;  
3.  
北京技术北京  
100089)  
:
,  
针对口语文本短小以及研究的本文提户关系的自适应博  
, , , ,  
首先 特征空间 作为合 然针对文的分特  
,  
以及的目的 变换特征空间 基础上 进的  
K-means  
算法合进聚  
, , .  
划分即当题目本文通过  
Twitter  
, ,  
数据进结果表明 法  
、  
变化以及提高荐 舆分析  
域提了有撑  
:
;
;
;
;
; K-means  
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
适应 用户关标  
算法  
0372-2112 ( 2017) 06-1375-07  
DOI: 10. 3969 /j. issn. 0372-2112. 2017. 06. 014  
:
TP391  
:
A
:
文章编号  
文献标识码  
电子学报  
A Self-Adaptive Microblog Topic  
Tracking Method by User Relationship  
12  
1
1
3
BAI Wen-yan ZHANG Chuang XU Ke-fu ZHANG Zhi-ming  
( 1. Institute of Information EngineeringChinese Academy of SciencesBeijing100093China;  
2. School of Computer ScienceBeijing University of Posts and TelecommunicationsBeijing100876China;  
3. Information Technologies Co( Beijing) LtdBeijing 100089China)  
Abstract: Considering the colloquialshort text and other characteristics of microblog and deficiencies in research of  
itthis article proposes a self-adaptive topic tracking method of microblog by user relationship. First of allduring the track-  
ing time windowthe candidate tweet set is mapped into feature space. Secondlyaiming at the characteristic of tweet distri-  
bution and the purpose of topic trackingthe paper converts the tweetsfeature space. Based on this operationa binary clus-  
tering on tweets set can be constructed by improved K-means clustering algorithm. The yielded relative collection is the tar-  
get model of the current topic. The experiments with the data extracted from Twittershow that this method can track down  
the trend of hot topics and the evolution of focuses in real timeand improve the stability of topic tracking in microblog. This  
method serves well for user recommendation and public opinion analysis.  
Key words: microblog; topic tracking; self-adaptive; user relationship; polar coordinates; K-means algorithm  
题的着迫 踪  
( Topic  
1
引言  
TrackingTT)  
是信研究域的一旨  
随着广使空 间  
踪  
数据文  
题的有相的进和  
,  
以及视间中 微  
,  
变情况 统的有  
往往注热点从  
、 、 ,  
容短小 以  
, ,  
博  
针对不  
: 2015-07-24;  
: 2016-01-08; :  
责任编辑 覃怀银  
收稿日期  
修回日期  
:
基金项目 国家自然科学基金  
( No. 61602474)  
1376  
2017  
,  
适用 因此基础上 微  
本文提的自跟  
: ( 1)  
文  
具有以下献  
助  
,  
处理 点问现在的  
, ,  
文的来自于从  
数据进  
( 2)  
借助增加性  
推  
, ,  
特征空间换 使线而  
行持需求  
使的提高断  
2
作  
( 3)  
与准性  
逐条分  
针对点 许突破长  
, ;  
相  
文本技术 新  
生成新切  
, ,  
的研究 在国文的行了研究 其  
( 4)  
题的变  
上进  
1]  
Twitter  
上的数据 提通过题模型  
基于  
, ,  
关注的  
2]  
3]  
测  
通过代  
题  
以及  
果 不 的  
4]  
5]  
6]  
稀疏矩阵 法解决  
率  
别  
3
研究内容  
在国内 一针对开  
3. 1  
跟踪模型  
在本文的型中 合 分  
,  
研究 针对文本处理题 提特征  
7 ~ 9]  
:
法  
文本的计了  
10]  
11]  
12]  
“ ” ”  
别是 网合 带合  
距  
基于度  
构  
特征度  
13]  
“ ” 1 ,  
以及 权值特征在  
特征取和相算  
14]  
, ,  
过程断地将非  
基础上 用  
K-means  
基于微  
题模类  
15]  
户标新已有用权值  
得  
,  
以及户标户 其类  
研究展  
、  
于一沿着时线不断地增加淘  
针对国内了  
过期特征权值点  
, ,  
的研究 前  
, , ,  
合 在过程随着题的特征中  
基于文本分技术实现法  
、  
本文主通过以  
训练 始  
特征三者用和影响来实现融  
, ,  
训  
, :  
户关系的自适应基本首  
,  
该  
, ,  
系统所有  
通过逐条实现题的没  
线展 其相  
用用有结前  
作为续  
题的短小口语的文本  
, ,  
的重据 然题  
.  
往往出特针对点  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载