您的位置:首页 > 其它

实战智能推荐系统(4)-- 什么是好的推荐系统?

2018-03-27 17:47 274 查看

推荐系统与搜索引擎

要回答什么是好的推荐系统,我觉得首先得知道为什么需要推荐系统。推荐系统的存在价值必须建立在两个必要的前提:

(1)信息过载。
随着信息技术和互联网的发展,人们逐渐从信息匮乏走向了信息过载时代。比如说如果在小超市买个东西,一件一件挑就是了。但是在淘宝网买东西,假设不使用搜索引擎,大量的物品让用户根本无法选择。
(2)用户需求不明确。
如果用户需求明确,正如前面举得例子。假如我明确知道自己想要买某件商品,那我直接用搜索引擎不就解决了?还需要什么推荐系统吗?所以这也是推荐系统存在的前提之一。

如何在用户需求不明确的情况下推荐?

对于这个问题,假设你想看一部电影,于是打开某个视频网站。发现里面积累了近百年的各种类型的电影,这个时候你又不知道该看什么电影。于是,你可能会问身边的朋友,有没有什么电影推荐。或者根据自己的喜好,比如自己喜欢看喜剧,在喜剧类选择一个评分较高的电影看。或者看下根据热门电影排行榜,选择比较热门的一部电影。人就是用户,电影是物品,上面的方式就是将人和物品联系起来的方式。
推荐系统也是通过类似的方式将人和物品联系起来,只是不同的推荐系统可能选择的方式不一样。推荐系统在电子商务(亚马逊),电影和视频网站,音乐电台(豆瓣),社交网络(Facebook)等领域都是采用了推荐系统的不同应用联系方式。

推荐系统测试

1.离线实验
(1)通过日志系统获得用户行为数据,并按照一定格式生成一个标准的数据集
(2)将数据集按照一定的规则分成训练集和测试集
(3)在训练集上训练用户兴趣模型,在测试集上测试

(4)通过事先定义的离线指标评测算法在测试集上的预测结果
2.用户调查

离线实验的指标和实际的商业指标存在差距,比如预测准确率和用户满意度之间就存在很大差别,高的预测准确率并不代表满意度。因此,如果要准确评测一个算法,需要比较真实的环境,最好的方法就是将算法直接上线测试。但是上线测试会有较高的风险,所以在上线测试前需要做一次用户调查。
3.在线实验

在完成离线测试和必要的用户调查后,可以将表现比较好的算法做AB测试。通过一定的规则将用户随机分组,并对比不同组的用户采用不同的算法后比较结果。

推荐系统评测

美国《连线》杂志主编在 2004 年发表了《长尾理论》,指出传统的80/20(80%的销售额来自20%的品牌)原则在互联网的加入下会受到挑战。与热门品牌相比,长尾商品的数量及其庞大,也许会超过热门商品带来的销售额。
如果一个推荐系统能够准确预测出用户的购买意向,是否就是一个好的推荐系统?答案是否定的,因为即使推荐系统不预测用户购买意向,用户自己也会去购买它。从某种程度上来说,就是一个看起来效果很好却失败的推荐系统。因为就算不预测我会购买它,我也会自己通过搜索引擎去购买它,实际上对销售额并没有任何意义。
所以,良好的推荐系统不仅仅能够准确预测用户的喜好,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣,但不那么容易发现的东西。同时,推荐系统还要能够帮助用户将那些被埋没在长尾中的好商品推荐给可能会感兴趣的用户。挖掘长尾的销售额。而这是搜索引擎无法办到的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  推荐系统