您的位置:首页 > 其它

毕设笔记

2015-03-11 12:28 501 查看

A Survey of Collaborative Filtering Techiques (1)

Collaborative filtering (CF)

协作过滤这个词自从被Tapestry发明出来之后,被推荐系统圈子里面的人广泛采用,尽管这个词有点词不达意--推荐引擎并没有和接受者协作,也不是通过过滤掉那些不该推荐的物品(其实是挑选出来那些接受者感兴趣的)。

CF的最基本的假设是如果用户X和Y都对n个物品的评价类似,或者拥有相同的行为(购买,观看,听),那么他们也会对其他的东西有类似的评价或者行为。

什么是所谓的评价?一可以是显式的打分(1-5分),也可以是隐式的指示,比如说购买或者点击。

CF有很多challenge:1,sparsedata;2,实时性,3,同义词困扰(类似的物品的名字也同样类似);4,shillingattack(欺诈攻击);5,数据噪音;6,隐私保护问题。

早期的CF使用用户评价数据来计算相似度或者用户/物品之间的权重,仅以进行预测或者推荐。这就是所谓的memory-basedCF,著名的亚马逊就是采用这种方法的。但是这种方法也有明显的局限性,因为他是基于commonitems,所以当数据很稀疏或者数据很少的时候就不能有效的预测了。人民的智慧是无穷的,绞尽脑汁又搞出来model-basedCF,他使用评价数据来估计或者学习模型来做预测,这里的模型可以是数据挖掘或者机器学习的模型。比较著名的又贝叶斯信任网络CF,聚类CF,潜在语义CF,还有压倒一切既有系统的马尔科夫决策过程CF。

其实除了CF之外,还有一类方法叫做content-basedfiltering,它是通过分析文本内容来找到内容里面的规则,挖掘出用户和物品的特征来预测和推荐。还有一种,他把memory-basedfiltering和content-based filtering合起来,成为混合cf。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  推荐系统