该文章是对《精益数据分析》第一章部分内容的总结。由于翻译和行文思路的关系,该书的后续内容推荐大家去看主讲人的视频。
一、为什么需要数据分析?
对产品来说,改进方案的产生需要直觉和数据。其中,直觉需要数据分析进行验证,直觉的产生需要数据分析作为前提。常见的改进路径是:数据分析/直觉产生——专人接待式最小可行化产品——数据分析——改进
二、常见的比较性指标
①定性指标与量化指标
在一开始缺少用户的情境下,更多的采用的是定性指标。
定性数据是杂乱的、主观的、不精确的。如果定量数据回答的是“什么”和“多少”这样的问题,那定性数据回答的就是“为什么”。定量数据排斥主观因素;定性数据吸纳主观因素。
②虚荣指标与可付诸行动的指标
如果一个数据不知如何根据它采取行动,该数据就仅仅是一个虚荣指标。可能只是招商的工具。每当看到一个指标,就应该下意识地问自己:“依据这个指标,我将如何改变当前的商业行为?”
下面列举一些典型的虚荣数据指标:点击量、页面浏览量(PV值)、访问量、独立访客数、网站停留时间(time on site)/浏览页数(number of pages)、下载量。
所以对数据分析来说,埋点就显得非常重要。一个反面例子就是这次的ARG,由于时间比较紧张没有埋点,最后显示的数据虽然比较好看,但对下一批产品改进的帮助不是很大。
③先见性指标与后见性指标
先见性指标(或称先见性指示剂)可用于预测未来。比如,透过“销售漏斗”中现有的潜在客户数,你能大致预测将来所能获得的新客户数。
后见性指标能提示问题的存在,比如用户流失(即某一时间段内离开某产品或服务的客户量。
在一个公司中,某一团队的后见性指标有时是另一个团队的先见性指标。例如,季度订单量对于销售团队而言是一个后见性指标(合同已经签订了),但对于财务部门来说,它是一个可以指示营收预期的先见性指标(因为客户还没有支付合同金)。
④相关性指标与因果性指标
在两个数据指标之间发现相关性不是一件坏事,发现相关性可以帮助你预测未来,而发现因果关系意味着你可以改变未来。
比如,对ARG来说,QQ群内的活跃人数和游玩网站的人数既是正相关,也有可能是因果关系。在分析数据时,要关注这种综合体的关系。
三、理想指标的改变
你在早期所选定的目标往往是尝试性的,不是板上钉钉。你追逐的是一个移动的目标,因为此时你根本无法定义何为成功。在创业过程中,调整目标和关键数据指标都是可行的。
最初版产品(最小可行化产品)面市之初,你甚至不知道他们会用你的产品来做什么。有时用户对你的产品的真实用法会和你的假设大相径庭。
你可能以为大家愿意玩你的多媒体游戏,结果却发现他们只把你当成了一个照片上传服务。
四、数据圈套
假设数据没有噪声。为获取的数据去噪是很耗时的一道工序,而回报通常是巨大的,往往简单的一步去噪就可能揭示重要的规律。
一些常见的数据噪声:忘记归一化、排除异常点、包括异常点、忽视季节性、抛开基数侈谈增长、关注噪音。
“人类与生俱来的模式识别能力,容易使我们误以为无规律的事物是有规律的,”莫尼卡提醒创业者,“把虚荣指标放在一边,退后一步,站在更高的角度看问题。”
以上是这次分享的全部内容,希望在数据采集、数据清洗、数据分析上对你有所启发。