这才是数据分析师的最佳实践
一日,有军吏二人,俱身热头痛,症状相同,但华佗的处方,却大不一样,一用发汗药,一用泻下药,二人颇感奇怪,但服药后均告痊愈。原来诊视后,已知一为表证,用发汗法可解;一为里热证,非泻下难于为治。
这是民间流传的一则华佗小故事,核心思想是表达华佗的医术神妙,相同的表征用不同的处方给治好了,外人不明觉厉
华佗
图片来源百度百科
难搞的肚子疼
同样,表征相同,病理不同的事情在现代医学中太多了。病人描述的也不够清晰,导致一个简单的“肚子疼”,牵扯出了数十种病因。下图是丁香园整理的腹痛原因图,一般人估计都看晕了。
丁香园出图
我们在做数据分析的时候,看到GMV/销售额下降,跟“肚子疼”是一个意思。往大了说,企业内部的经营模式、目标人群,企业外部的市场情况、政策因素;往小了说,运营层面活动的规则、产品层面landing page及后续流程的设计,都会导致最终结果的下降。
医学的解决办法
面对腹痛如此复杂的病因,医学已经有非常成熟的解决方案,甚至已经有专门研究如何逐步确定病因的学科--《诊断学》。
但是遗憾的是,数据分析是商业行为,业内并没有统一的操作标准,应对如此复杂的情况。大抵是因为每个分析的商业主体太个性化导致的。
大家可以看看《诊断学》的教学内容,其中有症状学、病史采集、各种检查、临床诊断步骤和病历书写。
各位数据分析师们,有没有感觉似曾相似?是不是跟我们做数据分析非常相似?
症状学--业务理解
病史采集--数据采集
各种检查--各种指标、报表、临时SQL提数
临床诊断步骤--根因查找
病历书写--数据分析报告(不含方案和测算部分)
上图是我根据工作经验整理的数据分析4步法,其实跟《诊断学》教学内容非常相似,殊途同归。
第一次有此发现的时候,我非常兴奋,两个领域的知识相互印证,于是我也逐步开始研究医学是如何发现问题、探究问题、确认根因和解决问题的。
锁定病因的步骤
图片来源见水印
上图就是医学上诊断“肚子疼”的标准操作流程,确认一步,再进一步收集信息,再确认一步,再收集信息,逐步的逼近真相。这跟我们做数据分析是一样一样的。
当然,脑子非常灵活的人会立刻反应过来:现实情况比这复杂的多,往往是多种情况交织的,那应该如何处理?
医学上研究这种情况的分支叫《老年医学》,老年人通常会并发多种疾病。在《协和老年医学》中,对这种情况,制定的策略是“全人个体化、诊疗团队化”的原则,疾病的急性期以“痊愈”为目标,慢性期以“维稳”为目标,总体目标是维持患者的功能状态。得到上的薄世宁提了”第一张骨牌法则“,流传更广的叫”二八法则“。其实说的都是一个逻辑:即找到最关键的因素,遇到急性因素,应该先解决问题,长期因素,应该徐徐图之。
小心愿
我在数据分析这个领域从业十多年了,涉及过2G、2B、2C的各个领域,从技术端的ETL数据处理、数仓建设、数据中台,到业务端的报表、多维分析,再往上的商业分析、商业模式均有涉猎。
数据分析师就像是企业的医生,对比医学,数据分析体系化和标准化还差的很远。我期望能够像《诊断学》一样,总结一套完整的从病症到根因的数据分析操作流程,帮助到大家,开箱即用。
- 【转载】我的Lean & Agile(精简和敏捷)经历(这才是最佳实践)
- 【转载】我的Lean & Agile(精简和敏捷)经历(这才是最佳实践)
- 我的Lean & Agile(精简和敏捷)经历(这才是最佳实践)
- 【转载】我的Lean & Agile(精简和敏捷)经历(这才是最佳实践)
- Maven学习笔记十六:Maven坐标和依赖(最佳实践之归类依赖)
- 打造用户最喜爱的产品----最佳实践经验之十大要点
- OSGi原理与最佳实践——字典服务declarative Service实现
- iOS应用开发最佳实践
- azure 最佳实践 -- 使用正确的数据存储
- Citrix项目最佳实践一
- 十个JDBC的最佳实践
- Property和实例变量(Ivar)的最佳实践
- [转] Hadoop MapReduce开发最佳实践(上篇)
- J2ME最佳实践 - 1
- 45个实用的JavaScript技巧、窍门和最佳实践
- Android应用启动最佳实践
- .NET中异常处理的最佳实践(译)
- 使用WebSphere MQ最佳实践 TOP 15
- C#编码标准 - 指导和最佳实践 - Juval Lowy
- javascript最佳实践