您的位置：首页 > 其它

推荐系统中的同现矩阵问题

2016-12-07 15:35 1431 查看

最近在研究Hadoop大数据方面的知识，正巧看到了推荐系统，其中里面有个同现矩阵很是让我蒙圈，查了很多blog之后，写下来与大家分享。

1.建立同现矩阵的过程

在协同过滤算法中同现矩阵的建立是极其关键的一部，原始数据如下：

1,101,5.0
1,102,3.0
1,103,2.5
2,101,2.0
2,102,2.5
2,103,5.0
2,104,2.0
3,101,2.0
3,104,4.0
3,105,4.5
3,107,5.0
4,101,5.0
4,103,3.0
4,104,4.5
4,106,4.0
5,101,4.0
5,102,3.0
5,103,2.0
5,104,4.0
5,105,3.5
5,106,4.0

第一个数字是用户ID，第二个数字是电影ID，最后一个数字是用户对该影片的打分结果。首先看到用户1，观看了101,102,103。则按照同现矩阵的思想，对（101,101）、（101，102）、（101,103）（102,101）、（102,102）、（102,102）（103,101）、（103,102）、（103,103）点位加一，表示用户1对101,102,103影片的关联程度加一，同理将其余4个用户对影片的关联程度都相加，得到同现矩阵如下：

2.建立用户评分矩阵

用户评分矩阵即为用户i对产品打分的矩阵表示，以用户3为例：

U3
[101] 2.0
[102] 0.0
[103] 0.0
[104] 4.0
[105] 4.5
[106] 0.0

3.计算推荐得分

同现矩阵*用户评分矩阵=推荐分矩阵

由于同现矩阵的意思就是商品之间的关联程度，由于我们已经知道用户评分矩阵，所以即便用户对某一商品没有使用或者打分

但是根据其他相关联产品我们也可以得出一个推荐系统。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航