推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

一种引入加权异构信息的改进协同过滤推荐算法

更新时间:2019-12-30 13:26:28 大小:913K 上传用户:IC老兵查看TA发布的资源 标签:协同过滤元路径 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

协同过滤作为当前应用最成功的推荐技术之一,其推荐质量在很大程度上取决于近邻用户选取的准确性,而数据的稀疏性问题(sparsity)和相似度度量方式(similarity metrics)严重影响着最近邻的选择。该文提出了一种引入加权异构信息的改进协同过滤算法。首先利用异构网络中丰富的语义信息和边属性信息,得到用户之间基于不同元路径的相似度;然后将相似度分别应用到典型的基于用户的协同过滤推荐算法中,得到基于每个相似度的用户评分值;最后采用监督学习算法为每个打分值分配不同的权重,融合为用户最终评分。在扩展Movie Lens经典数据集上的实验结果表明,本文所提算法在精确度上较传统算法有显著提高。


部分文件列表

文件名 大小
1577683582一种引入加权异构信息的改进协同过滤推荐算法.pdf 913K

【关注B站账户领20积分】

部分页面预览

(完整内容请下载后查看)
47 1 期  
20181月  
电 子 科 技 大 学 学 报  
Vol.47 No.1  
Jan. 2018  
Journal of University of Electronic Science and Technology of China  
一种引入加权异构信息的改进协同过滤推荐算法  
张海霞1,2,吕 振1,2,张传亭1,2,袁东风1,2  
(1. 山东大学信息科学与工程学院 济南 250100; 2. 山东省中国虹计划协同创新中心 济南 250100)  
摘要协同过滤作为当前应用最成功的推荐技术之一,其推荐质量在很大程度上取决于近邻用户选取的准确性,而数  
据的稀疏性问题(sparsity)和相似度度量方式(similarity metrics)严重影响着最近邻的选择文提出了一种引入加权异构信息的  
改进协同过滤算法。首先利用异构网络中丰富的语义信息和边属性信息,得到用户之间基于不同元路径的相似度;然后将相  
似度分别应用到典型的基于用户的协同过滤推荐算法中,得到基于每个相似度的用户评分值;最后采用监督学习算法为每个  
打分值分配不同的权重合为用户最终评分扩展MovieLens经典数据集上的实验结果表明文所提算法在精确度上较  
传统算法有显著提高。  
关 键 词 协同过滤; 元路径; 推荐系统; 相似度; 加权异构信息  
中图分类号 TP391  
文献标志码  
A
doi:10.3969/j.issn.1001-0548.2018.01.017  
An Improved Collaborative Filtering Recommendation Algorithm with  
Weighted Heterogeneous Information  
ZHANG Hai-xia1,2, LÜ Zhen1,2, ZHANG Chuan-ting1,2, and YUAN Dong-feng1,2  
(1. School of Information Science and Engineering, Shandong University Jinan 250100;  
2. Collaborative Innovation Center of China Rainbow Project Jinan 250100)  
Abstract Collaborative filtering is oneofthe most successful recommendation technologies, and the quality  
of collaborative filtering is determinedby the accuracy of the nearest neighbors. Data sparsity problem and  
similarity metricsseriously affect the choice of the nearest neighbors. Different from traditional recommendation  
tasks, in this paper, we propose an improved meta path-based collaborative filtering algorithm for weighted  
heterogeneous information networks. Firstly, we calculate the similarity among users based on different meta path  
by utilizing the rich semantic information and attribute information in weighted heterogeneous networks. Then we  
apply the similarity to user-based collaborative filtering algorithm and get multiple predicted rating scores based on  
different similarity. Finally we calculate the final predicted scores by combining various meta path information  
using supervised machine learning algorithms. The method is evaluated with the extended MovieLens dataset and  
experimental results show that our approach outperforms several traditional algorithms and make the result of  
recommendation more accurate in terms of accuracy.  
Key words collaborative filtering; meta path; recommendation system; similarity; weighted  
heterogeneous information  
协同过滤(collaborative filtering)[1]是推荐系统发  
展史上发展最快、应用最广的一类算法,其基本思  
想是相似的用户对商品的选取也是相似的,根据与  
目标用户最相似的K个邻居对目标项目的评分来进  
行推荐。但是传统的相似度度量方式只考虑了用户  
评分这一个因素,评分矩阵是极其稀疏的,这种情  
况下得到的用户相似性是不准确的,最终推荐精度  
自然不高。  
包含多种实体(entity) 实体间存在多种关系  
(relation) 这种网络被称为异构信息网络[2]  
(heterogeneous information network, HIN)。大数据时  
代的HIN中包含丰富的语义信息,对其进行深度挖  
掘分析能够得到非常有意义的知识[3-4],而HIN中包  
含的更多的有效信息会带来更好的推荐效果[5-6]所  
以近年来开始兴起在HIN上做推荐问题的研究HIN  
中包含多种类型的实体和多种多样的边信息。为了  
更好地利用异构网络中所蕴含的多样性内容,可以  
近年来,社交网络朝异质性方向发展:网络中  
收稿日期:2017 - 01 - 11;修回日期:2017 - 10 - 09  
基金项目:山东省自主创新及成果转化重大专项(2013ZHZX2C0102, 2014ZZCX03401)  
作者简介:张海霞(1979 - ),女,博士,教授,主要从事无线通信网络和新一代信息技术方面的研究.  
1期  
张海霞,等一种引入加权异构信息的改进协同过滤推荐算法  
113  
用元路径(meta path)表示不同的关系[7]实体之间  
的语义信息路径为一条元路径,两节点间不同的元  
路径代表不同的语义联系。基于元路径开展了大量  
的工作,相似度度量是其中最重要和基础的一个方  
向,基于对称元路径的PathSim[7]和基于任意元路径  
PCRW[8]HeteSim[9]等算法相继被提出3种  
算法都是建立在无权异构网络基础上,忽略了HIN  
中的边属性信息,因此都不能被直接应用到加权  
HIN上的推荐工作中。利用元路径的概念可以灵活  
地运用HIN中丰富的信息来做推荐[9]。  
φ W W 表示每条边的权wW 属于集合  
W φ(w)W 只要 W 0 满足 B 1 或  
R 0 ,该信息网络即为WHIN。图1为一个典型的  
WHIN络中包含7种节点类型和12种实体间的关系。  
国家  
1
体裁  
1
标签  
1
用户  
1
演员  
1
电影  
1
目前基于HIN的推荐工作还处于起步阶段,文  
[10]结合用户评分和多种实体相似度度量方式提  
出了一种新的矩阵分解推荐框架Hete-MF;文献[11]  
引入异构网络信息提出了一种基于协同过滤的社会  
化推荐方法Hete-CF方法将社会网络中的异构关  
系融合进了协同过滤推荐算法中,改善了原算法中  
数据稀疏和冷启动问题[12]利用用户的隐式反  
馈信息结合用户不同的异构关系提出了一种新的个  
性化推荐方法Hete-Rec。一方面,上述方法都旨在  
融合异构网络中的多元信息并且只考虑了HIN中的  
部分信息;另一方面,上述方法并没有考虑网络中  
的边属性问题,没有关注由用户两极化评分造成的  
本质差别。以电影推荐网络为例,5分表示喜欢,1  
分表示讨厌;同样,一部电影被贴上某种标签的次  
数越多代表该电影越偏向于此类型。如果在推荐过  
程中不考虑此边属性问题,很可能会使推荐结果有  
所偏差。文献[6]提出了加权HIN的概念,通过区分  
网络中边上的不同属性值来探索更全面的元路径语  
义信息以实现更准确的推荐,但该方法并没有提出  
新的相似度度量方法,而是将有权元路径分解为有  
确定属性值限定的原子元路径,利用的还是原有的  
相似度度量方法。本文引入加权HIN的概念,充分  
考虑HIN中的节点类型信息和多种边属性信息,并  
且对用户评分进行了两极化映射处理,提出了一种  
引入加权异构信息的改进协同过滤算法。  
演员  
2
用户  
2
电影2  
电影3  
体裁  
2
标签  
3
导演  
1
导演  
2
标签  
2
国家  
2
1 加权HIN示例  
1.2 加权网络模式  
定义 2 加权网络模式WHIN可以用加权网络  
模式[7,9] S = (B,R,W ) 来简化表示B表示网络中  
的节点类型R 表示网络中的边类型,W 表示网络  
中边的权重。加权网络模式对网络中节点和边的类  
型进行了限制,正是这种限制导致了网络的半结构  
化,指导了网络的语义内涵探索。  
对于图1中的网络加权网络模式如图2所示,  
该网络模式清晰地表现了图1WHIN中所有的节  
点类型和节点间带权重的关系。通过此网络模式,  
研究者可以清楚地分辨复杂的HIN中本质上存在的  
节点类型以及各节点类型间可能存在的关系。  
主演(A)  
导演(D)  
被演绎 被导演  
1
1
演绎  
1
导演  
1
评分/被  
属于/  
用户(U)  
电影  
(M)  
体裁(G)  
评分15  
1  
1 问题定义  
上映地  
被标记次  
1  
1-42  
1.2 加权异构信息网络  
被标记次  
上映地  
142  
1  
定 义 1 加 权 异 构 信 息 网 络 (weighted  
heterogeneous information network, WHIN)[7,9]:可以  
用一个有向G = (V, E,W ) 表示,且节点类型映射  
V B ,表示每一vV 属于节点类型集  
B (v)B ψ 示边类型映射函数,  
ψ (e)R 表示每一eE 属于边类型集R 射  
国家(C)  
标签(T)  
2 加权异构信息网络的加权网络模式图  
1.3 加权元路径  
定义 3 加权元路径权元路径[7,9] P 定义在  
加权网络模S = (B, R,W ) 不引起歧义的情况  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载