推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

Coteries轨迹模式挖掘及个性化旅游路线推荐

更新时间:2019-12-26 12:58:38 大小:1M 上传用户:IC老兵查看TA发布的资源 标签:组模式挖掘Coterie 模式 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

Coterie是一种异步的组模式,要求在不等时间间隔约束下,找出具有相似轨迹行为的组模式.而传统的轨迹组模式挖掘算法往往处理具有固定时间间隔采样约束的GPS数据,因此无法直接用于Coterie模式挖掘.同时,传统组模式挖掘存在语义信息缺失问题,降低了个性化旅游路线推荐的完整度和准确度.为此,提出基于语义的距离敏感推荐策略DRSS(distance-aware recommendation strategy based on semantics)和基于语义的从众性推荐策略CRSS(conformity-aware recommendation strategy based on semantics).此外,随着社交网数据规模的不断增大,传统组模式聚类算法的效率受到极大的挑战,因此,为了高效处理大规模社交网轨迹数据,使用带有优化聚类的MapReduce编程模型来挖掘Coterie组模式.实验结果表明:MapReduce编程模型下带优化聚类和语义信息的Coterie组模式挖掘,在个性化旅游路线推荐上优于传统组模式旅游路线推荐质量,且能够有效处理大规模社交网轨迹数据.


部分文件列表

文件名 大小
Coteries轨迹模式挖掘及个性化旅游路线推荐.pdf 1M

部分页面预览

(完整内容请下载后查看)
软件学报 ISSN 1000-9825, CODEN RUXUEW  
Journal of Software,2018,29(3):587-598 [doi: 10.13328/j.cnki.jos.005452]  
©中国科学院软件研究所版权所有.  
E-mail:  
Tel: +86-10-62562563  
Coteries 轨迹模式挖掘及个性化旅游路线推荐∗  
李晓旭  
,
于亚新  
,
张文超  
,
(东北大学 计算机科学与工程学院,辽宁 沈阳 110819)  
通讯作者: 于亚新, E-mail:  
: Coterie 是一种异步的组模式,要求在不等时间间隔约束下,找出具有相似轨迹行为的组模式.而传统的轨  
迹组模式挖掘算法往往处理具有固定时间间隔采样约束的 GPS 数据,因此无法直接用于 Coterie 模式挖掘.同时,传  
统组模式挖掘存在语义信息缺失问题,降低了个性化旅游路线推荐的完整度和准确度.为此,提出基于语义的距离敏  
感推荐策略 DRSS(distance-aware recommendation strategy based on semantics)和基于语义的从众性推荐策略  
CRSS(conformity-aware recommendation strategy based on semantics).此外,随着社交网数据规模的不断增大,传统组  
模式聚类算法的效率受到极大的挑战,因此,为了高效处理大规模社交网轨迹数据,使用带有优化聚类的 MapReduce  
编程模型来挖掘 Coterie 组模式.实验结果表明:MapReduce 编程模型下带优化聚类和语义信息的 Coterie 组模式挖  
,在个性化旅游路线推荐上优于传统组模式旅游路线推荐质量,且能够有效处理大规模社交网轨迹数据.  
关键词: 组模式挖掘;Coterie 模式;MapReduce;优化聚类;语义路线推荐  
中图法分类号: TP311  
中文引用格式: 李晓旭,于亚新,张文超,王磊.Coteries 轨迹模式挖掘及个性化旅游路线推荐.软件学报,2018,29(3):587-598.  
英文引用格式: Li XX, Yu YX, Zhang WC, Wang L. Mining coteries trajectory patterns for recommending personalized travel  
routes. Ruan Jian Xue Bao/Journal of Software, 2018,29(3):587-
Mining Coteries Trajectory Patterns for Recommending Personalized Travel Routes  
LI Xiao-Xu, YU Ya-Xin, ZHANG Wen-Chao, WANG Lei  
(School of Computer Science and Engineering, Northeastern University, Shenyang 110819, China)  
Abstract: Coterie is an asynchronous group pattern that finds the group patterns with similar trajectory behavior under unequal time  
interval constraints. The traditional trajectory pattern mining algorithm often deals with GPS data with fixed time interval sampling  
constraints, which cannot be directly used for coterie pattern mining. At the same time, the traditional group pattern mining has the  
problem of missing semantic information, and thus reduces the completeness and accuracy of individualized tourist routes. To address the  
issue, two semantic-based tourism route recommendation strategies, distance-aware recommendation strategy based on semantics (DRSS)  
and conformity-aware recommendation strategy based on semantics (CRSS), are proposed in this paper. In addition, with the increasing  
size of social network data, the efficiency of traditional group model clustering algorithm is of great challenge. Therefore, in order to deal  
with large-scale social network trajectory data efficiently, MapReduce programming model with optimized clustering is used to mine the  
coterie group pattern. The experimental results show that the coterie group pattern mining with optimized clustering and semantic  
information under the MapReduce programming model achieves better recommendation quality than the traditional group pattern travel  
route in the personalized tourism route recommendation and can effectively handle the large-scale social network trajectory data.  
Key words: group pattern mining; coterie pattern; MapReduce; optimal clustering; semantic route recommendation  
基金项目: 国家重点研发计划(2016YFC0101500)  
Foundation item: National Key Research and Development Program (2016YFC0101500)  
本文由基于图结构的大数据分析与管理技术专刊特约编辑林学民教授、杜小勇教授、李翠平教授推荐.  
收稿时间: 2017-08-01; 修改时间: 2017-09-05, 2017-11-07; 采用时间: 2017-11-24; jos 在线出版时间: 2017-12-05  
CNKI 网络优先出版: 2017-12-06 15:23:38, http://kns.cnki.net/kcms/detail/11.2560.TP.20171206.1523.015.html  
588  
Journal of Software 软件学报 Vol.29, No.3, March 2018  
Instagram 作为流行的图片共享社交应用,被游客广泛用于记录位置、时间、UGC(user-generated context)  
等旅行信息,其主要包含旅行路径行密度分布动模式等.因此,如何有效挖掘大规模 Instagram 轨  
迹数据,对于旅游路线推荐有着极其重要的作用.但目前存在的轨迹组模式挖掘仅适用于数据等时间间隔采样  
GPS 轨迹数据.此外,随着社交网的不断发展,数据规模也逐渐增大,形成了轨迹大数据,MapReduce 作为一  
种并行编程框架为大规模数据处理提供了便捷.可以看出,社交网轨迹大数据目前面临着以下问题:1) 聚类算  
法能否通过 MapReduce 并行优化处理提高效率;2) 传统轨迹组模式具有输入数据等时间间隔采样约束,能否找  
到适用于具有离散性、随机性的 Instagram 数据轨迹组模式挖掘方法;3) 目前存在的组模式只考虑轨迹信息,  
没有考虑社交网 UGC 信息对旅游路线推荐的影响,能否将 UGC 与社交网轨迹信息结合起来,完成基于轨迹组  
模式的个性化旅游路线推荐.这些问题在旅游路线推荐中存在挑战,目前尚未发现将以上几点结合起来进行旅  
游路线推荐的研究工作.  
基于上述问题,提出以下解决策略.  
·
首先,基于 MapReduce 并行编程框架实现轨迹大数据聚类处理,并且改进了 PRBP 算法[1]完成社交网  
数据优化分区,有效提高了聚类算法的效率;  
·
其次,目前存在的轨迹组模式处理均为 GPS 轨迹数据,无法有效处理具有离散性机性的 Instagram  
社交网轨迹数据.Coterie 组模式通过采用异步策略完成组模式挖掘,解决了上述组模式同步相等时  
间间隔约束问题.Coterie 模式是在异步情形下,某一时间间隔内具有相似路径的轨迹组;  
最后,在基于组模式个性化旅游路线推荐中,传统组模式挖掘由于语义信息缺失导致个性化推荐不完  
,因此提出基于语义的距离敏感推荐策略 DRSS(distance-aware recommendation strategy based on  
semantics)和基于语义的从众性推荐策略 CRSS(conformity-aware recommendation strategy based on  
semantics)两种推荐策略完成路线推荐.  
·
本文主要框架为通过基于 MapReduce DBSCAN 算法提高聚类算法效率完成轨迹数据聚类处理,并且通  
过提出的 nPRBP 算法对数据进行优化分区处理;然后,通过 ClusterGrowth 算法找出 closed coteries,主要包含前  
验剪枝、后验剪枝、规则验证这 3 个处理步骤;最后,closed coteries 中通过提出的 DRSS CRSS 推荐策略  
完成旅游路线推荐.  
本文第 1 节介绍相关工作.2 节定义必要的概念.3 节介绍 nMR-DBSCAN 优化聚类.4 节说明 Coterie  
轨迹组模式挖掘.5 节介绍基于语义的个性化旅游路线推荐.6 节提供研究实例和实验结果.最后,7 节总  
结全文.  
1
相关工作  
随着社交网的不断发展,用户社交网信息不断增加.如何有效地从社交网信息中挖掘出有价值的信息,对当  
前社交网发展起着不可替代的作用[2].在社交网中,用户可以上传文本信息、位置信息和时间信息等,还可以将  
这些信息共享给好友和附近的人.如今,越来越多的学者意识到社交网信息的重要性,并陆续投身到社交网信息  
挖掘的研究中来.  
社交网数据挖掘思想与 GPS 轨迹数据挖掘思想相似.GPS 轨迹数据挖掘中,主要应用包括关联规则异  
常行为、出行方式[3-5]GPS 轨迹推荐[6].数据采集时间具有严格的等时间间隔限制,SHAHED[7]就体现了这个  
特点.在社交网轨迹数据挖掘中,应用主要包括位置推荐、路线推荐和行为偏好推荐[8-11].数据采集时间具有离  
散性和随机性,这也是社交网轨迹数据和 GPS 轨迹数据的主要区别.  
目前,在社交网数据挖掘中有很多处理方法,主要包括数据挖掘中聚类、分类等传统技术.其中,通过聚类方  
法找出社交网中组模式挖掘手段,对于推荐用户路线和位置有很好的效果[12].在大规模数据处理上, MapReduce  
框架被广泛使用.目前,将聚类算法与 MapReduce 框架结合进行大数据分析处理的方法逐渐发展,例如基于  
MapReduce DBSCAN 聚类算法[13],取得了良好的效果.  
组模式挖掘方法主要有 swarmflockconvoygatheringplatoon ,文献[14-17]详细介绍了不同的组模  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载