您的位置:首页 > 其它

【转载】论文读书笔记-personalized news recommendation based on click behavior

2016-02-13 18:05 344 查看
比较经典的论文,有时候想起来,想再看看,总是不知道放哪儿了。索性放到blog上,随时查阅。

论文分享链接:http://pan.baidu.com/s/1o7eroxW

还有一篇别人的阅读笔记,挺好的。出处:http://www.aiuxian.com/article/p-334703.html

==================================================================

说明:这篇论文主要介绍了google依据用户点击行为进行新闻推荐的系统,该推荐系统的大概流程如下:首先是对大量的点击日志进行分析,然后根据贝叶斯网络预测用户的新闻喜好,在预测时采用基于内容的推荐和协同过滤相结合的方法实现个性化的新闻推荐。

主要要点如下:

1、原有的协同过滤的缺陷:

如果仅仅依靠协同过滤,每条新闻必须要在其他用户点击后才能进行对应的推荐,但是新闻一般都是实时更新的,无法做到被及时点击。同时并不是所有的用户都是一样的,协同过滤并未考虑到用户之间的差异性。

2、日志分析

新闻不同于搜索,搜索都带有特定目的,新闻只是给用户提供一些感兴趣的东西,用户的新闻喜好会不断改变。在对日志进行分析时,可以把新闻分为若干个类别category, C={c1,c2...cn},D(u,t)代表在第t个月中用户u的点击分布:



其中Ni代表第t个月中被用户点击的类别为ci的新闻个数,Ntotal是用户在这段时期所有的点击次数,D(u,t)体现为用户在各个新闻类别上的比例。

3、用户喜好变化

如果用户喜好不变,其点击分布情况应该不变,可以计算出用户喜好的差异情况:



得到的结果发现用户喜好会发生较大的改变,这表明用户的旧的访问记录对于未来的预测意义不大。

4、新闻趋势的变化

用D(t)表示某个国家在t时间内的点击分布情况,能够发现有重大事件发生时,新闻的趋势会发生很大改变,除此之外,各个国家的新闻趋势也不尽相同,因为每个国家的人民喜好不同。新闻趋势会对用户的喜好产生影响,相比较而言,同一个地区的用户喜好较为接近。

5、四个结论

-用户个人喜好确实会随着时间改变

-大众的点击分布反映了新闻的趋势,这一般与重大事件产生相关

-在不同地方存在不同的新闻趋势

-在一定程度上,个人用户的新闻喜好与本地的新闻趋势相一致

6、贝叶斯框架

我们把用户喜好分为两个部分,一个是用户的真实喜好,一个是本地新闻趋势的影响。用户的真实喜好是长期的,跟用户直接相关,反映的是用户的个人特质;本地新闻趋势的影响是短期的,改变较快。具体做法是:首先不考虑新闻趋势,根据每一个阶段用户的访问记录推断出用户的真实喜好;其次把所有阶段的预测情况综合起来得到一个更为精确的用户真实喜好;最后根据求得的用户真实喜好和本地新闻趋势预测用户的当前喜好。

使用贝叶斯公式得到下面的式子:



其中pt(category=ci|click)代表用户点击属于类别ci的概率,可以由D(u,t)求得。Pt(category=ci)是新闻被划为类别ci的先验概率,pt(click)是用户点击的先验概率。P(click|category=ci)表明用户对类别ci新闻的点击概率。由此,可以得到用户对于类别ci新闻的喜好:



我们假设用户点击的先验概率是不变的:



现在再考虑本地新闻趋势的影响,可以认为在当前一段很短的时间内的点击分布反映出本地新闻趋势,用p0(category=ci)表示:



可以假设用户点击新闻的概率是固定的:



为了平滑,加入一些虚拟点击数据:



这种做法的好处是,如果用户的点击率较低,系统将会根据当前的新闻趋势进行推荐。同时用户的喜好也能够不断更新。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: