您的位置:首页 > 其它

推荐系统实践整体化总结

2015-05-09 11:14 369 查看
这一阵子在找实习,总的情况来看,一点都不理想,做了总结,主要是由于我的理论不够扎实,实践又不多导致的,其实这两者是有一定的联系的,因为实践的不多,所以理论上的提升就非常的有限。最近比较喜欢推荐系统相关的内容,因此就找了项亮的《推荐系统实践》来看,心想现在终于可以理论和实践相结合了。

  刚开始读这本书,就觉得写的非常的简单易懂,因此我是一口气读完整本书的,好久没有一次性读完200页的书了,在这期间当然我也敲了一些代码,因为我的python功底确实没有,所以看着伪代码就总是怀疑它的正确性,只有自己敲出来才觉得松了一口气,才开始相信它的话。

  花了5天的时间读完,今天就做一个整体的总结,希望通过这个总结看到推荐系统的主流和缺陷,然后根据这些来指导我的下一步的深入的学习。

1、好的推荐系统

  主要讲了如何评测推荐系统:

  实验方法主要包括离线实验、用户调查和AB测试。

  评测指标对应有用户满意度(针对后两种实验方法)、预测准确度(评分预测、TOPN预测)、覆盖率、多样性、新颖性、惊喜度。

2、利用用户行为数据:

  充分利用用户的行为数据诸如浏览、购买、点击、评分、评论等来设计推荐系统。

  主要分为显性行为和隐性行为两种,因此可以分为用户评分预测和TopN推荐两种。

  TopN推荐主要预测用户会不会对某部电影评分,评分预测则是在预测用户在准备对某部电影评分的前提下会给多少分。

3、推荐算法:

  1>基于邻域的算法:

    基于用户的协同过滤:

    基于物品的协同过滤

  2>隐语义模型

  3>基于图的模型

4、推荐系统的冷启动问题:

  1>利用用户注册信息

  2>选择合适的物品启动用户兴趣

  3>利用物品的内容信息

  4>发挥专家的作用

5、利用用户的标签数据:(UGC)

6、利用上下文信息:

  1>时间上下文

  2>地点上下文

7、利用社交网络数据

8、评分预测算法:

  1>平均值

  2>基于邻域方法

  3>隐语义模型与矩阵分解模型

  4>加入时间信息

  5>模型融合

以上是这本书的主要研究内容,虽然简单但是包括推荐系统极大主流的算法,无论在学术界还是工业界,但是在实际的应用时绝对不是只使用一种推荐算法的,因为这些算法各有其优缺点,因此通过融合不同的算法来提高推荐系统的整体性能才是王道。但是作为基础研究,首先最基本的就是把单独的这几种算法进行实现和实践,充分体会其优缺点,然后针对这些优缺点找到最优秀的融合算法来进行实验研究。

因此接下来的任务就是,1周的时间python实现所有的主流的算法,并在netflix数据集上进行实验,体会各种算法的复杂度和优缺点。同时要关注最新的这些算法的改进。

之后就是算法融合方面的实验研究。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: