毕设笔记
2015-03-11 12:28
501 查看
A Survey of Collaborative Filtering Techiques (1)
Collaborative filtering (CF)协作过滤这个词自从被Tapestry发明出来之后,被推荐系统圈子里面的人广泛采用,尽管这个词有点词不达意--推荐引擎并没有和接受者协作,也不是通过过滤掉那些不该推荐的物品(其实是挑选出来那些接受者感兴趣的)。
CF的最基本的假设是如果用户X和Y都对n个物品的评价类似,或者拥有相同的行为(购买,观看,听),那么他们也会对其他的东西有类似的评价或者行为。
什么是所谓的评价?一可以是显式的打分(1-5分),也可以是隐式的指示,比如说购买或者点击。
CF有很多challenge:1,sparsedata;2,实时性,3,同义词困扰(类似的物品的名字也同样类似);4,shillingattack(欺诈攻击);5,数据噪音;6,隐私保护问题。
早期的CF使用用户评价数据来计算相似度或者用户/物品之间的权重,仅以进行预测或者推荐。这就是所谓的memory-basedCF,著名的亚马逊就是采用这种方法的。但是这种方法也有明显的局限性,因为他是基于commonitems,所以当数据很稀疏或者数据很少的时候就不能有效的预测了。人民的智慧是无穷的,绞尽脑汁又搞出来model-basedCF,他使用评价数据来估计或者学习模型来做预测,这里的模型可以是数据挖掘或者机器学习的模型。比较著名的又贝叶斯信任网络CF,聚类CF,潜在语义CF,还有压倒一切既有系统的马尔科夫决策过程CF。
其实除了CF之外,还有一类方法叫做content-basedfiltering,它是通过分析文本内容来找到内容里面的规则,挖掘出用户和物品的特征来预测和推荐。还有一种,他把memory-basedfiltering和content-based filtering合起来,成为混合cf。
相关文章推荐
- mahout+eclipse推荐系统开发学习之helloworld
- 基于内容的推荐Content-based Recommendation
- 长期招聘:个性化推荐
- 《推荐系统实践》 阅读笔记
- 推荐系统
- 推荐系统:寻找相近用户——欧几里德距离评价
- 推荐系统:寻找相近的用户——皮尔逊相关度评价
- 各个领域著名的推荐系统
- 推荐系统综述——只谈感受不谈理论
- svd++
- SVD因式分解实现协同过滤-及源码实现
- 协同过滤 --- 数据挖掘学习笔记
- 基于Mahout的电影推荐系统
- 模式识别、推荐系统中常用的两种矩阵分解-----奇异值分解和非负矩阵分解
- 随时更新———个人喜欢的关于模式识别、机器学习、推荐系统、图像特征、深度学习、数值计算、目标跟踪等方面个人主页及博客
- 一个简单的在线推荐系统的实现
- 基于标签的推荐系统学习(1)
- 计科1111-1114班《算法》加分题(20-50分)
- 推荐系统根据最近浏览进行推荐
- 如何评价一个好的推荐系统算法