登录
首页精彩阅读数据分析的一些误区
数据分析的一些误区
2016-09-19
收藏

数据分析的一些误区

1.忽略沉默的数据

二战时英国空军为了降低飞机的损失,决定给飞机的机身进行装甲加固。由于当时条件所限,只能用装甲加固飞机上的少数部位。他们对执行完轰炸任务返航的飞机进行仔细的观察、分析、统计。发现大多数的弹孔,都集中在飞机的机翼上;只有少数弹孔位于驾驶舱。从数据上说, 加固机翼的性价比最高. 但实际情况缺恰恰相反, 驾驶舱才是最应加固的地方, 因为驾驶舱被击中的飞机几乎都没飞回来.
   "发声"的数据是最好获取的, 但如果没把这些沉默的数据考虑进来, 那么这种数据分析是不靠谱的。
       在某些场合下,被你忽略的沉默信息,恰恰是关键信息。很多人会忽视这类关键的沉默信息,反而重视一些显眼,但不关键的信息。
  在上述这个例子里,很多人想当然地(先验地)认为返航的轰炸机就是全部的样本。当他们开始思索答案的时候,就已经把那些中弹坠毁的飞机忽略掉了。所以,最终得出了相反的结论。

2.把沉默用户当作支持和反对的中间态
     两家网站A和B,都经营类似的业务,都有稳定的用户群。它们都进行了类似的网站界面改版。改版之后,网站A没有得到用户的赞扬,反而遭到很多用户的臭骂;而网站B既没有用户夸它,也没有用户骂它。如果从数据来看, 应该是网站B的改版相对更成功, 因为没有用户表达不满。但事实并非如此。网站A虽然遭到很多用户痛骂,但说明还有很多用户在乎它;对于网站B,用户对它已经不关心它了.
    网站A指的是Facebook,网站B是微软旗下的Live Space。

比如在管理方面,如果员工经常对公司的缺点提出批评,至少说明员工还比较在乎公司,希望公司能够改进。比如在婚姻方面,如果夫妻俩经常吵架,说明情况还不是算糟糕。如果双方连吵架都懒得吵,只剩下冷漠以对,那问题才真是严重了。

对于这类误区的总结,重点就是一句话:爱的反面不是恨,是漠然。很多时候,沉默/漠然/冷漠,是比“恨”更糟糕的反应。千万不要忽视了这种反应。

3.把数据作为决策的唯一标准
    通常认为数据分析指导工作是一种高性价比的做法, 不容易犯错, 对于代表资方的管理层来说, 比起依赖于人的决策, 依赖于数据的决策似乎更稳健. 这种决策在从0.5向0.8的产品改进上, 可能是有效的. 因为一个已有的产品, 数据就摆在那. 100个用户50个访问超时, 解决了这个问题, 就提升了50%的效果.
但对于从0到0.1的新产品上, 由于数据很难获取, 需要花大力气在获取模拟数据上. 往往是用一周时间去想明白一个做两个小时的产品该不该做的问题. 而且模拟的结果还和最终实际相差很远.
    A/B test或是原型系统, 先做出来, 再去验证, 在一些场合下比先拿数据要有效的多.

4.认为数据是绝对客观的
      数据本身是带有主观性的, 完全客观的数据是没有的. 数据的获取方法, 数据的解读方法, 数据的统计方法, 都是人的决策. 一份数据拿出两个相反的结论来也不是没有可能. 即使主观上没有偏向性, 也受限于方法和视野. 
     决策上最终起作用的还是人不是数据. 虽然人有那么多的不确定性, 还可能出现争论, 扯皮, 不敢承担责任.


数据分析咨询请扫描二维码

客服在线
立即咨询