常用的数据分析方法(1)
逻辑树分析方法是把复杂问题拆解成若干个简单的子问题,然后像树枝那样逐步展开。
一. 5W2H分析方法
5W:what(是什么)、when(何时)、where(何、why(为什么)、who(是谁)
2H:how(怎么做)、howmuch(多少钱)
5W2H分析方法可以帮助我们解决简单的问题,下面举一个例子:
案例:如何设计一款产品?
what(是什么):这是什么产品?
when(何时):什么时候需要上线?
where(何地):在哪里发布这些产品?
why(为什么):用户为什么需要它?
who(是谁):这是给谁设计的?
how(怎么做):这个产品需要怎么运作?
howmuch(多少钱);这个产品里有付费功能吗?价格是多少?
二.逻辑树分析方法
2.1什么是逻辑树分析方法?有什么用?
逻辑树分析方法是把复杂问题拆解成若干个简单的子问题,然后像树枝那样逐步展开。

2.2 如何使用逻辑树分析方法?
逻辑树分析方法是由科学家费米提出来的,例如:北京有多少辆特斯拉汽车?某胡同口的煎饼摊一年能卖出多少个煎饼?深圳有多少个产品经理?一辆公交车里能装下多少个乒乓球?一个正常成年人有多少根头发?
费米问题可以考察出一个人有什么样的思维方式,是否有理科思维。回答费米问题,可以用到逻辑树分析方法,将一个复杂的问题拆解成子问题,然后逐一解决。
下面为一个例子:
有人曾经问费米:“芝加哥有多少钢琴调音师?”
对于这个问题,可以使用逻辑树分析方法来拆解。
钢琴调音师数量=全部钢琴调音师1年的总工作时间/一位调音师每年的工作时间。
所以,可以把这个问题拆解为两个子问题:
(1)全部钢琴调音师1年的总工作时间;
(2)一位调音师每年工作时间。
对于全部钢琴调音师1年的总工作时间,又可以拆解成3个子问题:
(1)有多少架钢琴;
(2)钢琴每年要调几次音;
(3)调一次得多长时间。
现在我们一个个去解决这些子问题。

1.第1个子问题:有多少架钢琴?
我们再把它拆分,首先需要知道芝加哥有多少人,其次需要知道拥有钢琴的人所占的比例。芝加哥的人口可以通过网络查出来,大概有250万人,拥有钢琴的比例大概是2%左右。有了这些数据,就可以算出芝加哥大概有5万架钢琴。
2.下面来看第2个和第3个子问题:
第2个子问题:钢琴每年要调几次音?钢琴调音师属于稀缺行业,人肯定不多,钢琴也不像吉他需要频繁地调音,估计是一年1次。
3.第3个子问题:调一次得多长时间?
大概是2小时。
4.第4个子问题:一位调音师每年工作多长时间呢?
一年大概工作50周。按一周工作5天,每天8小时来算,就可以得到一位调音师每年工作时间是2000小时。但是钢琴调音师要四处跑,路上肯定要花时间,所以减去20%用在路上的时间,调音师每年大概工作 (2000-2000x20%)=1600h。
5.现在我们把4个子问题汇总一下:
全部钢琴调音师1年的总工作时间是3个子问题的数字相乘,一共是100000h,而调音师每年工作1600h,我们用全部钢琴调音师1年的总工作时间,除以一位调音师每年工作时间,四舍五入,费米预测芝加哥大概有63位调音师。
三.多维度拆解分析方法
3.1 多维度拆解分析方法有什么用?
对于多维度拆解分析方法,要理解两个关键词:维度、拆解。
中国人口结构变化意味着在中国人口红利消失,老龄化人口越来越多。如果你的亲戚去医院看病,不知选择哪家医院更好,这时候你学到的分析方法能起到非常关键的作用。
假设在每个医院最近收治的1000例患者中,A医院有900例患者存活。然而,B医院只有800例患者存活。这样看起来,A医院的存活率更高,应该选择A医院。你的选择真的是正确的吗?
现在根据患者的健康状况,我们将每家医院入院的总人数拆解为两组,一组是轻症患者,一组是重症患者。然后我们再来计算患者存活率。
A医院有100例患者入院时是重症患者,其中20例存活;
B医院有400例患者入院时是重症患者,其中200例被救活了。
所以,对于重症患者,去B医院的存活率更高,是更好的选择。

用同样的方法分析, B医院依旧是更好的选择。
通过多维度拆解数据,我们发现了和一开始截然相反的结论,这种现象被称为“辛普森悖论”,也就是在有些情况下,考察数据整体和考察数据的不同部分,会得到相反的结论。只看数据整体,我们可能注意不到“数据内部各个部分构成的差异”。
辛普森悖论时不时出现在现实生活中。英国一项调查显示,在20年里,吸烟者生存率高于不吸烟者。但是把参与者按年龄维度分组后,发现不吸烟组人群的平均年龄显著较高,所以年龄才是导致不吸烟组生存率低的原因。
3.2 如何使用多维度拆解分析方法?
一般会从指标构成或者业务流程的维度来拆解。
3.2.1 从指标构成来拆解:
例如,某店铺最近做了一个活动,但是活动后发现预期销售额没达成,原因是什么呢?
销售额=新用户销售额+老用户销售额
然后可以继续拆解新用户的转化和老用户的复购:
新用户销售额=新用户数x转化率x新用户客单价;
老用户销售额=老用户数x复购率x老用户客单价。
如果是“新用户”导致的销售额目标没达成,可以对新用户发小额无门槛的折扣券,因为新用户往往还没有对店铺建立信任,不会第一次就购买很多。如果是“老用户”导致的销售额目标没达成,可以对老用户发高额满减折扣券,起到提升复购率的效果,
3.2.2从业务流程来拆解
一家线上店铺做了一波推广,老板想看看推广效果如何,你该怎么办呢?
推广效果衡量指标为新增用户数。
我们可以按指标构成如城市、性别、渠道来拆解新增用户数。

按照地域细分,考察一线、二线、三线及以下等不同城市的新增用户数量情况;
按照性别细分,考察男性用户、女性用户分别是多少;
按照渠道细分,考察公众号、百度、头条哪个渠道的用户来源多。
从地域维度来看,北京、上海等一线城市新增用户多,说明一线城市的用户对公司产品更感兴趣;
从性别维度来看,男性用户多于女性用户;
从渠道维度来看,渠道A新增用户数最多,渠道B新增用户数接近A,渠道C新增用户数最少。

那么,渠道A、渠道B、渠道C哪个用户渠道的质量更高呢?
我们可以从业务流程来拆解分析,考察哪个渠道来的用户更愿意在店铺购买。
用户购买的业务流程,可以分为4步:
第1步,看到渠道的广告;
第2步,被广告吸引进入店铺;
第3步,在店铺选择感兴趣的商品;
第4步,选择好商品,最终决定购买。

我们看到虽然渠道A带来的用户多,但是最终购买人数却低于渠道B带来的用户数,所以,渠道B的用户质量更高。
更多推荐


所有评论(0)