您的位置:首页 > 其它

基于在线评论的推荐系统研究综述

2016-06-08 00:36 393 查看
摘要

引言

标准推荐方法
基于内容的方法

基于评分的协同过滤方法

基于偏好的产品排序方法

摘要

  最近几年,推荐系统的研究者提出了很多基于在线评论的推荐系统,旨在将用户文本评论中有价值的信息融入到用户建模和推荐过程中。先进的文本分析和观点挖掘技术使得我们可以抽取不同类型的评论中的元素,如评论讨论的主题,观点的多维特征,上下文信息,比较的观点,评论者的情感。本文我们从一个整体的视角来看待如何利用评论中的元素来提升标准的基于内容的推荐,协同过滤和基于偏好的产品排序技术。我们重点强调了基于评论的推荐系统缓解评分稀疏性和冷启动问题的能力。本综述将目前的研究氛围了两个主要支线:基于评论的用户建模和基于评论的产品建模。在用户建模研究中,在线评论不仅被用于创造基于术语的模型,还用于推断用户评分。评论的多维特征也可以进一步来推断用户对个特征的偏好权重。在产品建模领域,产品可以用用户对各个维度的观点或者比较观点来充实以更好反应其质量。

引言

  协同过滤技术在有足够的评分信息时表现很好,但是在遇到评分稀疏性问题时效果有限。为此,研究者提出了基于内容的方法,这类方法仅仅依赖产品的内容表示就可以向目标用户推荐那些与他们之前选择的产品有着相同内容的产品。有些研究使用其它形式的用户生成内容如标签、社交关系来提升推荐精度。不过这些方法仍然不够,特别是当目标用户只有少量历史数据时。

  因此本文特别强调用户评论,并回顾了最近的相关工作:利用评论中的有用信息解决评分稀疏性问题。社交媒体和电子商务网站的流行使得用户自发地写评论描述他们对产品的评价。这些评论通常是以文本的形式解释根据他自己的使用经验,为什么他喜欢或者不喜欢某件产品。因此系统可以刻画用户评论的多层次特性,从而为用户构建一个更精细的偏好模型,往往这些根据整体评分不能推断出来。从营销和消费者行为学的实证研究发现也证明了产品评论对新用户的决策过程的正面影响。

  越来越多的工作在将评论中包含的丰富信息融入到用户建模和推荐生成的过程中。评论中的信息可以通过下面三种方式融入推荐系统中:(1)首先评论中的信息可以通过提供关于用户偏好的额外信息来解决大数据稀疏性的问题。当极端的情况即没有评分可以利用时,我们可以利用评论来推断协同过滤系统所需的评分;(2)评论信息可以解决新用户的冷启动问题。推荐系统中通常存在这样两种新用户:一种对产品有着有限的经验,因此没有提供很多评分;另一种用户完全就是新用户。对于第一种类型,4.3节总结了现有研究的处理方式:将评论信息(如评论主题或者特征观点)与数值评分匹配从而为较少评分的用户进行建模。对第二种类型的用户,用户的当前评分只有在他使用系统时才能被抽取出来。因此我们主要关注使用评论元素帮助用户填充偏好或者富化产品模型。例如在产品建模中,评论中的比较观点对于构建产品与产品的比较关系,从而提升排序的质量(从评论中抽取比较观点用于排序模型中)。(3)当数据集不稀疏时,可以利用评论来决定评分的质量(评论有用性),还可以推断用户的与环境相关的偏好(从评论中抽取出环境信息),考虑从评论中提到的观点的特征来学习用户的隐式偏好。

  接下来,我们根据评论起到的作用将当前的研究分为两类:基于评论的用户建模和基于评论的产品建模。前者强调利用评论构建用户模型;后者关注利用评论构建产品模型。对于用户模型类,我们进一步将相关研究分成若干组:基于短语的用户模型,通过从评论中抽取频繁的短语构建用户模型(4.1);基于评分的模型,利用用户评论推断评分(4.2)或者提升现有评分(4.3);基于特征的偏好,将评论中用户的多层面观点具体化(4.4)。我们表明标准推荐方法如基于内容的方法,基于记忆的方法,基于模型的方法和基于偏好的产品排序方法,在融合评论后,推荐效果都有提高。我们还强调了这些基于评论的推荐系统在不同数据条件下的表现。最后我们讨论了这些发现的实际意义以及未来趋势。

标准推荐方法

基于内容的方法

  基于内容的方法主要用于推荐包含文本信息的产品,如文档,网站和新闻。它还出现在TV,电子商务和旅游推荐中。该方法假设产品的静态描述可以通过抽取频繁出现的产品得到,不过在实际中并不总是这样。另一方面就是这种方法是基于静态的描述,如果两个用户都访问了同样的产品但是对产品的偏好不同,那么他们还是有着相同的偏好(这个缺陷,除非提出显示的反馈或者基于用户评论都没法刻画吧)

基于评分的协同过滤方法

  基于属性的矩阵分解方法[Raghavan 2012][Seroussi 2011]

  新用户和新产品的冷启动问题。

基于偏好的产品排序方法

  当产品可以用属性集合如价格,重量,大小等描述时,我们就可以使用基于偏好的产品排序方法。在该方法中,用户的偏好表示为在每个属性上的偏好权重。

  具体地,用户的偏好可以表示为({V1,...,Vn},{w1,...,wn}),其中V1是用户在属性ai上的偏好值转换函数,wi是属性ai的相关性权重。例如,对于更大更好属性如摄像机的光学变焦转换函数可以定义为Vi(ai)=p(ai)−min(ai)max(ai)−min(ai) ,其中p(ai)是候选产品在属性ai上的值,min(ai)和max(ai)分别是属性ai在整个数据表中的最小和最大值。根据多值效用理论,对于每个产品<a1,a2,...,an>的效用计算为

  U(<a1,a2,...,an>)=∑i=1nwi×Vi(ai)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息