您的位置:首页 > 其它

推荐系统中的同现矩阵问题

2016-12-07 15:35 1431 查看
最近在研究Hadoop大数据方面的知识,正巧看到了推荐系统,其中里面有个同现矩阵很是让我蒙圈,查了很多blog之后,写下来与大家分享。

1.建立同现矩阵的过程

在协同过滤算法中同现矩阵的建立是极其关键的一部,原始数据如下:
1,101,5.0
1,102,3.0
1,103,2.5
2,101,2.0
2,102,2.5
2,103,5.0
2,104,2.0
3,101,2.0
3,104,4.0
3,105,4.5
3,107,5.0
4,101,5.0
4,103,3.0
4,104,4.5
4,106,4.0
5,101,4.0
5,102,3.0
5,103,2.0
5,104,4.0
5,105,3.5
5,106,4.0
第一个数字是用户ID,第二个数字是电影ID,最后一个数字是用户对该影片的打分结果。首先看到用户1,观看了101,102,103。则按照同现矩阵的思想,对(101,101)、(101,102)、(101,103)(102,101)、(102,102)、(102,102)(103,101)、(103,102)、(103,103)点位加一,表示用户1对101,102,103影片的关联程度加一,同理将其余4个用户对影片的关联程度都相加,得到同现矩阵如下:

2.建立用户评分矩阵

用户评分矩阵即为用户i对产品打分的矩阵表示,以用户3为例:
U3
[101] 2.0
[102] 0.0
[103] 0.0
[104] 4.0
[105] 4.5
[106] 0.0

3.计算推荐得分

同现矩阵*用户评分矩阵=推荐分矩阵
由于同现矩阵的意思就是商品之间的关联程度,由于我们已经知道用户评分矩阵,所以即便用户对某一商品没有使用或者打分
但是根据其他相关联产品我们也可以得出一个推荐系统。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: