您的位置：首页 > 大数据 > 人工智能

什么是多样性

推荐系统中的多样性分为两类：

个体多样性（individual diversity）
指对于每一个用户而言，推荐结果是否具有多样性;
整体多样性（aggregate diversity）
指对于整个推荐系统来说，它的推荐结果是否具有多样性。比如是否覆盖了足够多的物品，而不是只集中在小部分流行的物品。从这个角度上看，整体多样性就与之前提到的公平性中的流行度偏差属于一个范畴。

如何度量多样性

多样性的评价指标有很多，也可以根据不同的场景自行定义。这里列举几个：

思路都是让尽可能多的物品推荐给用户，而不局限于小部分物品。

覆盖率（coverage）
指在所有用户的推荐列表中，至少出现过一次的物品占物品总数的多少。按照经验，常规的推荐算法覆盖率都比较低，尤其是top-K的K值较小时。
熵（entropy）
从信息论的角度，不确定越大，就是物品分布越均匀，那么熵就应该越大。物品分布越均匀，就意味着物品被推荐的几率越平等，所以这个指标在某种程度上比覆盖率更好，因为覆盖率对于被推荐一次和被推荐多次的物品是没有区分的。
物品的分布：p(i|L)=物品i在所有用户推荐列表中出现的次数 / (用户数×K)

算法的流程采用常规的后处理（post-processing）方法，即在常规推荐系统推荐结果的基础上进行重排。

新的分享

章节导航