您的位置:首页 > 其它

Social Recommendation with Strong and Weak Ties论文解读

2020-03-05 21:16 1421 查看

introduction

这篇论文开头还是老生常谈,讲了一些推荐系统的研究意义,协调过滤,基于内容的推荐方法,以及推荐系统所面临的数据稀疏和冷启动的问题。为了解决这些问题,许多学者会用到user的社交信息。然后讲到了BPR的原理,和一些学者在BPR上做的一些变种(例如SBPR)。其次谈到之前的学者大多集中在对tie strength(用户之间的联结紧密度)的预测上,而没有研究tie strength的类型以及类型对推荐效果带来的影响。
tie的类别对推荐效果有影响,其理论基础来源于哈佛大学知名社会学家Granovetter。其研究介绍了几种不同的tie的类型strong,weak,absent,其中strong tie可以提高信息的置信度,而weak tie 可以扩展信息面,使user接触到更多的信息。其研究发现,很多求职者的面试机会或者工作源于关系并不那么密切的朋友(weak tie)。
然后,介绍了作者的所有的工作,包括

  1. 用一种方法将不同的strength的tie加以区分,并打上标签,讨论不同标签在推荐过程中的效果及作用
  2. 如何利用已有的标签改善推荐模型,提高推荐效

related work

这一个section,作者讨论了前人在做推荐时,对implicit和explicit 数据的一些处理方法。然后重点讲了一下BPR算法,SBPR的一些原理及其特点(BPR是作者用来改良的基baseline,所以重点讨论一下,当然social information属于implicit 数据)。随后作者指出,strong tie在社会科学领域中被广泛研究的,前人的推荐模型研究工作既没有融入一些社会科学的理论,也没有对不同的tie加以区分。这也是作者工作的创新点。

strong and weak tie


如图为一个简单的用户社交图,这一章节里,作者介绍了Granovetter的研究成果,作者举了一个简单的例子,一个研究人员,可能从一个平时接触不太紧密的同僚那儿获得感兴趣的论文,而不是最亲密的同僚。然后,这里必须考虑如何定义strong tie和weak tie。
3. 社会学家惯用两个人的紧密程度,交集来定义两人的tie是否strong,但是这种方式需要的数据无法获得。
4. 通过社区划分的方式,把一个大的图划分为多个子图,在同一个子图中,并具有连接关系的用户之间为strong tie,反之为weak tie。然而社区的划分方法有很多,具体采用哪种方式,难说。
5. 根据Onnela的研究表示,有strong tie的用户,有很多重叠的邻居,在此理论依据上,作者使用jaccard系数来衡量tie的strength
strength(u,v)=def∣Nu∩Nv∣∣Nu∪Nv∣ strength(u,v)=def \frac{\left| N_u\cap N_v\right|}{\left| N_u\cup N_v\right|} strength(u,v)=def∣Nu​∪Nv​∣∣Nu​∩Nv​∣​
tie是strong还是weak主要依赖阈值θG\theta_\mathcal{G}θG​

THE TBPR MODEL: BPR WITH STRONG AND WEAK TIES

Categorizing Items

首先要对所有的item进行一个分类,对于每个u而言
6. 已经被用户u选择过的item
7. item被具有和u有strong tie和weak tie的用户选择中过(JTC)
8. item只被具有和u有strong tie的用户选中过(STC)
9. item只被具有和u有weak tie的用户选中过(WTC)
10. item未被u和u的任何tie选中过
上面提到,weak tie可以在整个network中提供新信息,但是并不意味着用户更偏爱WTC。
作者对DBLP上的数据进行研究,如图(a)可以见,作者从DBLP中攫取的数据大部分的tie都属于weak tie,(b)显示大部分研究者倾向于引用来自于weak tie的论文。与此同时学者Gee用node相似度,和node之间的交集,还有一种类似Jaccard系数的方法来研究tie strength得到过和上图相似的结论。这也给作者用Jaccard系数衡量tie strength提供了依据。
在前人的工作中,一个重要的结论就是,weak tie由于占大多数,所以在协同推荐的过程中显得很重要,而strong tie由于其可靠性,在个性化推荐,个人兴趣的推荐显得重要(ps:两种不同tie,有不同的推荐作用)
在这里,作者提出了TBPR模型,其中TBPR模型认为,WTC数据集比STC数据集更重要,但是单个STC比单个WTC更重要。

Two variants of TBPR

这里介绍了作者基于上面讨论的理论基础,搞出的两个模型,两个模型各有侧重点。不得不提的是 pairwise,详细的pairwise可以参考BPR的论文,它不同于pointwise,pointwise靠的两个项目评分的绝对差异,而pairwise更粗粒度的衡量两个项目之间的喜爱偏好选择。

TBPR-W(Preferring weak ties)


这里是项目i和项目j的偏爱程度,consumed item偏爱度大于JTC,JTC大于WTC,WTC大于STC

TBPR-S(Preferring strong ties)


TBPR-S则是STC大于WTC。

L(θ)\mathcal{L}(\theta)L(θ)为目标优化函数,其中PrPrPr函数定义如下,其中PuP_uPu​和QiQ_iQi​分别是user和item的vector表示

那么其中有个问题,我们如何衡量Pr[w≥us]Pr[w\mathcal{\ge}_us]Pr[w≥u​s]呢。作者根据定义的strength强弱的阈值θG\theta_\mathcal{G}θG​

其中g(θG)g(\theta_\mathcal{G})g(θG​)定义为:

tsˉ\bar{t_s}ts​ˉ​和twˉ\bar{t_w}tw​ˉ​分别是所有strong tie和weak tie的平均值

加了正则化项之后的优化目标函数为J(θ)\mathcal{J(\theta)}J(θ),算法的整体过程如下

其中Pu,Qi,Qj,Qw,Qs,QkP_u,Q_i,Q_j,Q_w,Q_s,Q_kPu​,Qi​,Qj​,Qw​,Qs​,Qk​的梯度可以通过∂J∂P\frac{\partial\mathcal{J}}{\partial{P}}∂P∂J​和∂J∂Q\frac{\partial\mathcal{J}}{\partial{Q}}∂Q∂J​来计算,同样θG\theta{\mathcal{G}}θG也可以根据∂J∂θ\frac{\partial\mathcal{J}}{\partial{\theta}}∂θ∂J​来更新

EMPIRICAL EVALUATION

最后实验针对四个数据集来进行,分别是DBLP,Douban,Ciao,Epinions。采用的模型评估metric分别是Recall@5,precision@5,AUC,MAP,NDCG,MRR。最后实验效果如图


我们可以看到,和一些经典的社交推荐SBPR,和矩阵分解模型比起来,TBPR在多个metric上有着显著的提高。

CONCLUSION AND FUTURE WORK

  1. 这个模型的特点就是结合了社会科学的研究理论,创新性的在社交推荐的基础上引入tie的类型标签,并利用此标签,大幅度的提升了推荐效果。
  2. 改进的地方在于用来区别strong和weak的阈值θG\theta_\mathcal{G}θG​,文中的阈值是对于所有的用户,然而对于不同用户还可以有不同的阈值,这也是可以改进的地方。
  3. 本文度量tie strength使用的是jaccard,但是其实还可以使用Adamic-Adar或者Katz score等metric方法。

博主补充:读完整个文章,我觉得这篇文章其实很有意义。
第一,说实话针对社交网络中tie strength的研究文章很多,但是扎扎实实去和社会科学家的理论相结合的,基于社会科学家理论之上的模型,并不多见。在知网上针对tie strength做推荐的中文paper,会在node相似度的度量上进行改进,或者提出一些假设。这些改进在某种场景下,或者用某种数据做实验,的确可以获得improvement。但是,总的来说不如这篇好,所以各位在想idea或者做实际项目的时候,不需要盲目地堆砌模型,要从具体的问题,场景出发或者说引用其他领域的知识。
第二,这篇文章也有瑕疵,因为这篇文章着重于社交推荐,但是选择的baseline可以看出,除了SBPR是融入社交网络的推荐模型,其它的都是基于矩阵分解的模型,这样做对比,显然是一个发论文的trick。
第三,由于这篇文章是2016年CIKM的论文,2017年大佬何向南在提出的NCF模型中那篇paper里面提到。很多学者喜欢把预测评分表达为user向量和item向量的内积,但是r~=f(u,v)\tilde{r}=f(u,v)r~=f(u,v)中,用内积来当做f函数似乎不妥,所以NCF利用多层感知机来代替f,取得了很好的效果。这个方法对这个TBPR模型同样适用。

  • 点赞
  • 收藏
  • 分享
  • 文章举报
肖伟崎 发布了3 篇原创文章 · 获赞 0 · 访问量 65 私信 关注
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐