个人认为,数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
推荐书本《数据分析思维——分析方法和业务知识》,本文内容就是提取这本书的主体思维,以提高自身的数据分析素养。
先来点鸡汤:学会把书读薄,就要学会总结,撰写学习博客的过程就是加深印象的过程,也是持续提高自身素质的有效方法。冲冲冲!
此前篇章:
数据分析思维(二):分析方法——5W2H分析方法、逻辑树分析方法、行业分析方法
多维度拆解分析方法
1.1 什么是多维度拆解分析方法
理解两个关键词:维度、拆解
什么是维度?老妈从不同角度看待一个优秀男生(比如个子高、家境好、长的帅),这里的角度就是维度。
什么是拆解?拆解其实就是做加法。优秀A = 维度1 + 维度2+ 维度3 + ...
1.2 多维度拆解分析方法有什么用
举个例子:假如你医院看病,不知道选择哪家医院好
假设医院最近收治1000人,A医院有900例患者存活,而B医院只有800例,所以A医院存活率更高,所以你选择A医院。但是选择真的正确吗?
我们使用多维度拆解分析方法看看:
上述存活率是整体的,我们将患者人数拆分为轻症患者、重症患者两个组。
假设1000例患者中,A医院重症患者有100,其中20例存活;B医院重症患者有400,其中200例存活。因此对于重症患者,去B医院更好,重症存活率更高。
用同样分析方法,对于轻症患者,去A医院更好。
因此,通过多维度拆解数据,我们可能会得出一些与开始截然相反的结论(辛普森悖论)。如果只看整体,我们可能忽略了“数据内部各部分构成的差异”,从而产生一些业务上的问题。对于某一结论,需要从多维度去观察数据、验证数据。
1.3 如何使用多维度拆解分析方法
问题是从哪些维度去拆解?
(1)从指标构成来拆解
例如,某次活动结束后,销售额没达成,原因是什么呢?
从指标定义来拆解,销售额 = 新用户销售额 + 老用户销售额,而
老用户销售额 = 新用户数 * 转化率 * 新用户客单价,
老用户销售额 = 新用户数 * 复购率 * 老用户客单价。
拆解完后,我们从上面维度逐一排查原因,看看是哪部分出了问题。
(2)按业务流程来拆解
假如推广某产品,我们想要了解推广效果。假如指标是新增用户数,先按照指标构成来拆解,
我们以渠道来举例,渠道又可以分为渠道A、渠道B、渠道C。假如按渠道划分,A、B、C新增用户数如下:
渠道A新增用户数最多,但是并不是最好的。为什么这么说呢?接下来就是“按业务流程来拆解”这一内容了。
渠道的业务流程为:1看到渠道的广告 → 2进店 → 3选择商品 → 4购买
我们最终目的是为了提高店铺的销量,但是A新增用户数虽多,但是不是每一个用户都愿意购买。从上图看,最终愿意购买的用户数最多还是B,即便A的新增用户数最多。A的效果虽然好,但是就最终目的而言,渠道B的推广效果质量更高。
再举个例子:App新用户留存问题
假如业务流程为:
分析维度:
- 新用户可以分为哪几类?
- 在首页,新用户想要看到什么内容?
- 推荐的内容是用户想看的吗?
1.4 主要事项
我们进行多维度拆解分析后,得出了与一开始按照整体分析刚好相反的结论,但这并不是错误的。这就是辛普森悖论。它提供了我们对问题分析的另一个视角,供我们参考。
小结
# 文章仅供个人学习。后续还会继续更新。冲!