户查询推荐算法。将用户评分数据、项目属性以及项目类别
数据进行融合处理,将融合后的数据输入到神经网络中训
练,选取神经网络编码部分最后隐含层的值作为新输入融合
数据的特征编码,完成数据降维处理。对降维后的数据利用
欧氏距离算法构建索引,通过检索获取目标用户与查询目标
项目间的最近邻,计算查询目标与近邻间的近似度,通过近
似度对近邻评分结果加权,获得用户对查询目标项目的预测
评分,根据评分结果给出推荐。该方法在一定程度上提高了
样本数量。,(哦,c。)表示查询样本各个属性的条件概率,
,(c。)表示训练样本属性和链接的联合概率。经过朴素贝
叶斯网络模型训练后,即可对用户当前查询目标一进行链接
点击预测
(3)
c。)
u=P(c。)兀P(一l
式中,每个相关链接对应一个预测值,该值表征用户查询目
标与链接的点击相关度。
推荐精度,但计算过程较为复杂,推荐耗时长。文献[7]提出
一种基于用户搜索满意度状态的查询推荐算法。该算法可
为用户推荐不同类别的查询词,当用户对推荐结果较为满意
时,将为用户推荐更新后的结果;当用户对推荐结果不满意
时,该算法将为用户提供一些增强搜索信息表示能力的查询
词。该方法在一定程度上提高了推荐效率,但在实际的推荐
精度并不高。
考虑一个由n个链接和m个用户查询构成的二分图G,
u={(H。,口。), ,(u。,%)}表示链接节点,口f用于描述查询
结果的预测点击值,用户查询节点q。的相关值通过传播求
和.即
(4)
~2善南
其中,J}(u,)表示与uj相连的查询节点q;的数量,q表示链
接的预测值。根据用户查询历史数据预测其与链接的点击
率,即
针对上述问题,提出基于TF—IDF算法的物联网用户查
询目标自动推荐算法。该方法的创新点在于:
1)结合TF—IDF算法和信息熵算法构建物联网用户对
项目属性的兴趣度模型,并以此作为基础数据在目标用户所
属簇内计算用户近似度并寻找最近邻,使得物联网中近似用
"砉南半掣
其中,cz池(嘶,g;)表示q。的点击数量占总点击数量的概率。
通过朴素贝叶斯预测物联网用户查询行为,实质上是找
出查询与链接之间的关系,但没有考虑到用户历史查询与当
前查询之间的文本近似性,而通过融合用户当前查询和历史
查询文本近似度可以增强与用户查询目标直接相关的信息,
采用.,如cnrd相关系数一1来计算用户查询目标g和历史查询
文本吼间的近似度
户间的相关性增强,缩短寻找最近邻的查询时间,提高了推
荐效率。
2)针对物联网中用户间的共同评分项较少,用户评分结
果较为接近,导致最终计算得到的近似度较高的问题,利用
皮尔逊相关系数来计算物联网用户近似度,同时采用用户兴
趣向量替换用户评分向量,进一步提高了推荐算法的精度。
(6)
sim(g,g。)=l
g
q;l/l
g
u吼I
2用户查询目标自动推荐原理
在最终的用户查询目标推荐中,整合式(5)、式(6)则有
通过对用户查询点击数据进行分析与挖掘,训练朴素贝
叶斯模型,针对网络用户输入的查询,根据用户查询历史数
据预测其与链接的点击率,再采用二分图将链接的预测点击
值平均分配给相应的各个查询项,结合Jaccard近似度和时
间关联因子综合分析用户当前输入的查询与历史中查询的
相关度,选取最高相关度的项目推荐给用户,具体过程如下
所述:
%=c砉糍署+a删,
其中,a表示时间衰减因子,可依据不同的用户查询历史数
据选取合适的参数。通过对用户查询g。的相关值进行降值
排序,选取最高相关度的项目推荐给用户
(8)
Ⅳ= £(g,q。)
J=l
通过对用户查询点击数据进行分析与挖掘,训练朴素贝
叶斯模型伸J,每个与链接相应的查询作为训练样本r=
其中,£(g,吼)表示g与g。的相关性。
3
基于改进近似性度量的查询目标自动推荐算法
{(q。,H。), ,(g。,u。)},其中,g。=(g:, ,gn),矾表示第i
个训练样本的第J种属性。根据用户查询所需,利用式(1)
和式(2)计算出用户点击链接的先验概率P(c。)和样本属性
3.1用户聚类、近似度计算和最近邻查询
在进行物联网用户查询目标自动推荐过程中,采用,I'F
—IDF算法结合信息熵算法构建用户对项目属性的兴趣度
模型,运用s0M算法对兴趣度模型中的用户进行初步聚类,
将初步聚类中心和聚类簇数目作为K—means算法的初始聚
类质心和聚类簇数目,在目标用户所在的聚类簇中计算用户
近似度并寻找最近邻,具体过程如下所述。
的条件概率尸(矾Iq)
Ⅳ
(1)
P(c。)= ,(ct)/Ⅳ
^
N
(2)
尸(“Jq)= ,(d,ct)/ ,(%)
其中,Ⅳ表示各个链接的频数,,(c。)表示与链接相应的查询
假设,,={^, Z}表示用户查询项目属性集合,口。表
一38】一
万方数据
全部评论(0)