您的位置:首页 > 其它

用户画像知识

2017-06-24 23:54 246 查看
用户画像相关知识点

1、用户画像是什么?





用户画像(User Profile),即用户信息标签化

用户画像有很多的的标签组成,每个标签都规定了观察、认识、描述用户的角度。标签根据企业业务的发展情况,或多或少,对外而言都是一个整体,这个整体称之为用户画像。

2、为什么需要用户画像?

用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理。

大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。





用户画像的本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户。

3、用户画像怎么设计?

一个标签通常是人为规定的高度精炼的特征标识

3、1 数据源分析

构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。

对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式

这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。

  3.1.1 静态信息数据     

      用户相对稳定的信息。

  3.1.2 动态信息数据   

      用户不断变化的行为信息。

      在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。

3.2 目标分析

用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。

3.3 数据建模方法

如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事

  3.3.1 什么用户   

      关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

  3.3.2 什么时间     

      时间包括两个重要信息,时间戳+时间长度。

      时间戳,为了标识用户行为的时间点。

      时间长度,为了标识用户在某一页面的停留时间。

  3.3.3 什么地点   

      用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。

  3.3.4 什么内容

      每个url网址(页面/屏幕)中的内容。  

      对于每个互联网接触点,其中网址决定了权重;内容决定了标签。

  3.3.5 什么事  

      用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。     

      不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。

用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。

用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:

标签权重=衰减因子×行为权重×网址子权重

如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。

标签:红酒,长城

时间:因为是昨天的行为,假设衰减因子为:r=0.95

行为类型:浏览行为记为权重1

地点:品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7)

假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。

则用户偏好标签是:红酒,权重是0.95*0.7 * 1=0.665,即,用户A:红酒 0.665、长城 0.665

4、用户画像怎么开发?



5、用户画像工作坚持的原则(金融企业)

金融企业是最早开始用户画像的行业。

事实上,用户画像涉及数据的纬度需要业务场景结合,既要简单干练又要和业务强相关,既要筛选便捷又要方便进一步操作。用户画像需要坚持三个原则,分别是人口属性和信用信息为主强相关信息为主定性数据为主

5.1 信用信息和人口属性为主

描述一个用户的信息很多,信用信息是用户画像中重要的信息,信用信息是描述一个人在社会中的消费能力信息。

定位完目标客户之后,金融企业需要触达客户,人口属性信息就是起到触达客户的作用,人口属性信息包含姓名、性别,电话号码,邮件地址,家庭住址等信息。这些信息可以帮助金融企业联系客户,将产品和服务推销给客户。

5.2 采用强相关信息,忽略弱相关信息

强相关信息就是同场景需求直接相关的信息,其可以是因果信息,也可以是相关程度很高的信息。

5.3 将定量的信息归类为定性的信息

用户画像的目的是为产品筛选出目标客户,定量的信息不利于对客户进行筛选,需要将定量信息转化为定性信息,通过信息类别来筛选人群。

例如可以将年龄段对客户进行划分,18岁-25岁定义为年轻人,25岁-35岁定义为中青年,36-45定义为中年人等。可以参考个人收入信息,将人群定义为高收入人群,中等收入人群,低收入人群。

5.4 用户画像的方法介绍,不要太复杂

金融企业需要结合业务需求进行用户画像,从实用角度出发,我们可以将用户画像信息分成五类信息。分别是人口属性,信用属性,消费特征,兴趣爱好,社交属性。

  5.4.1 人口属性

  5.4.2 信用属性

  5.4.3 消费特征

  5.4.4 兴趣爱好

5.5 金融企业用户画像的基本步骤

  5.5.1 画像相关数据的整理和集中

  5.5.2 找到同业务场景强相关数据

  5.5.3 对数据进行分类和标签化(定量to定性)

  5.5.4 依据业务需求引入外部数据

  5.5.5 按照业务需求进行筛选客户(DMP(大数据管理平台)的作用)





内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: