您的位置:首页 > 其它

内容分析在用户反馈分析中的应用

2010-03-31 23:20 471 查看
*本文内容由渡劫、剑虹、和笔者共同提供,笔者整理归纳

TB最近在各个关键产品与购物流程中陆续加入了用户反馈入口(图1),也开设了各种官方论坛收集用户意见和建议,因此会收集到大量纯文本数据。如何对这些数据进行分析、从而指导产品改进?本文将讲述,将内容分析(content analysis)应用于网络文本数据(如,用户反馈)处理的理论基础与实际应用。包括:内容分析法简述;企业中应用内容分析的步骤与技巧。

图1:淘宝的用户反馈入口


PART1 理论基础:内容分析法简述
内容分析,是指利用明晰的编码规则,将大量文本信息转化为定量数据,并归于若干类别以分析信息特征的方法)。内容分析有三个特点:

1)客观性。内容分析不受主观偏见影响,有标准化的研究过程,研究员对结果持开放态度;
2)系统。内容分析过程(取样、分析、编码等)有统一、标准的规则和程序;
3)定性与定量结合。内容分析通过定性研究找出能反映内容本质的特征,又将文本转化为定量的数据,分析结果可用频次、百分比,或相关系数等来表示。
这种研究无需直接接触研究对象,在传播学、情报学、教育学等社会学科有广泛应用,但目的有所差别。鉴于本文所述的应用类型,更倾向从情报学的观点去定义内容分析的目的:通过分析内容了解本质性的事实和趋势,并揭示隐性问题。换句话说,在用户反馈分析中应用内容分析法,目的在于对反馈信息进行系统的归纳分类,整理问题点并评估其严重性,从而有针对地实施改进

内容分析的基本流程如图2所示。科研中,还有训练编码员(5、6环节间)、测量编码员之间可信度(6、7环节间)的步骤。在企业环境中由于受到时间等调研成本制约,可选择性执行这两步。具体每一步的实施将在PART2中通过实例详述。


图2:内容分析流程图

PART2 实践应用:步骤与技巧
如前所述,在企业的用户研究中利用内容分析处理文本型用户反馈数据,最终目的在于,通过科学有效地总结归纳问题来促进改进。因此应用文本分析的步骤和技巧有以下特点:
1)编码员(用户研究员)需要对产品/项目的功能等特征有充分了解;

2)抽样的时间点,会根据产品/项目的特点而定,如有无重大改进等;

3)分类以及后续数据分析维度的建立,是研究员与产品经理等项目组关键成员共同完成的;


现按照前文所述的分析流程,以旺铺升级后一周内的用户反馈分析为例,介绍内容分析在企业用户研究中的实践步骤。

第一步 对分析的目标和范围做出准确定义

分析目标:收集、归纳用户体验问题及用户看法

分析范围:

主题领域——以某产品,或某流程的用户反馈为范围
时间段——如,改版后一周内、新上线一周后……等。值得注意的是,在产品大事件(如发布、改版)时间段,收集到的问题会较多,用户反馈两极化明显。在系统大事件(down机等)时间段,反馈的问题会较集中,用户反馈多为抱怨。

呈现在用户研究报告中,也就是一句简短陈述,如:旺铺升级后一周内的用户反馈总结

第二步 决定抽样样本

包括决定以下三方面

1)内容源:选择从什么地方(帮派?问卷?…等)抽样

2)时间:选择在分析时间段的哪几天(全段?隔天?隔周?)抽样

3)内容:对内容进行随机或等距抽样
这意味着研究员要对产品周期有充分的了解和认识。在本例中,我们的抽样样本是,旺铺升级后一周内(7天)用户通过旺铺装修页面“提意见”入口(图3)提交的所有数据。

——>


图3:旺铺用户反馈收集入口

第三步 确定分析单位


分析单位是内容分析中的最小元素,要对此给出明确清晰的操作性定义。在本例中,分析单位就是一名用户所陈述的一条意见。值得注意的是,并非以一次提交的数据为单位,因为一名用户一次性可能提交若干条意见,需要把意见拆开,每条为一个分析单位。如图4所示,“删除模块删完不能添加”、“发布完又回到装修页面”分别是一个分析单位。

图4:分析单位举例


第四步 建立分类

分类是内容分析的关键步骤,决定了后续的定量分析的有效性。类别是内容分析的基本单位,每个分析单位都能且只能归入某类别中。在学术研究中,往往依据研究理论或参考过往研究结果来分类。在企业用研中,则要对产品有充分了解,并与产品经理合作制定分类框架。因为这便于分配问题解决负责人。
穷尽、互斥是分类的两大原则。分类应涵盖可能的问题范围,但由于事前无法全面预知内容,最好设立“其它”类以满足穷尽性。若有≥10%的分析单位被归入“其它”,则分类不当。类与类之间是不重合的,若有一个分析单位可归入两个或以上类别,则分类不当,或分析单位不准。
分多少类为合适?类别太多会导致某些类的分析单位少而失去统计意义;类别太少,不同性质的分析单位归入同一类,可能会掩盖显著性差异。考虑到将分类合并比将分类拆分容易,建议宁多勿少。在无从下手的情况下,可试检验50-100条分析单位。

在本例中的分类如图5——

图5:旺铺用户反馈的分类与说明
该分类倾向于以问题解决方(如系统问题由开发人员解决、功能需求由产品经理解决、交互问题由设计师解决)为基础维度,便于推动改进。对于页面、功能有限的产品/流程,也可按照页面或功能分类。对于本例,也有针对功能、页面进行分类,主要体现在二级编码中,详情见下。

第五步 ***编码表 试验性编码

***编码表是在大分类的基础上进行细化,以更好地聚焦问题。在这一步,要尽可能细致全面,才能保证有效的数据分析。对每个编码的含义要有所说明,尤其在编码者不止一人的情况下。在本例中,对功能需求这一大分类的部分编码如图6,其原则是尽可能涵盖所有功能。而对于系统问题交互体验问题,子编码又是应内容特点、以另外的维度设定的。

图6:编码表示例


在编码表***好后,抽取50-100条分析单位(如100条反馈)进行试编码(coding),以检验是否够细够全。当然了,在实际实施编码(第六步)过 程中可能发现编码不够用的情况。此时只能新增编码,并对该分类下的所有分析单位重新编码。所幸的是——也是内容分析的优点之一——即使发现问题,能在不影响数据本身准确性和完好性的情况下弥补错误。不像问卷调研或现场实验,一旦实施,有错误也无法弥补,只能抛弃数据。
第六步 收集数据 实施编码

收集数据就是按照之前所定义好的范围与抽样标准提取数据。通常将数据导入到EXCEL中进行处理。在本例中,每条用户意见(即最小分析单位)对应一行(图7)。

图7:原始数据示例



然后便可开始对每个分析单位进行编码,是纯人工的过程。目前也有一些文本分析软件可辅助,但这些基于分词技术的软件智能程度不足,且实施聚类分析对样本量有要求(至少上万条),更适合用于海量文本数据的分类。
编码过程可借助EXCEL的文本筛选功能。比如笔者用得较多的是“包含XX关键词” 的筛选方式(图8),能有效提高编码效率。在过程中要把无意义的分析单位(如在本例中,会有用户在反馈中打自己店铺的广告)给清理掉。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: