一、了解电商行业
-
了解电商
第一代电商:以供货为主,纯卖货,没技术
第二代电商:以推广流量为中心,刷单、直通车、报活动,不算利润,亏钱赚吆喝
第三代电商:以消费者为中心,看懂数据,了解买家,不看销量,看利润,通过社会化媒体与买家对话 -
行业现状
电商大数据伴随着消费者和企业的行为实时产生,广泛分布在电子商务平台(淘宝,京东,拼多多)、社交媒体(微信)和其他第三方流量入口(抖音,快手)上。
电子商务数据类型多种多样,既包含消费者交易信息、消费者基本信息、也包括消费者评论信息、行为信息、社交信息和地理位置信息等。这些信息的丰富,对于我们分析研究具有很重要的意义。
但是,随着信息的丰富,我们也遇到了相应的问题:
a. 海量数据
b. 数据的可读性 -
维度展示
在本次电商案例中,我们的字段有行ID,订单ID,客户对象,订单日期,地区,地区经理,类别,子类别,销售额,数量,退回,客户名称,利润等,在这些字段下面,一共有近5000条数据。通过这些数据,我们可以设计如下一些分析维度。序号 维度 1 2018年至2019年各品类商品销售额情况 2 2018年至2019年各地区商品销量情况 3 2018年至2019年各地区经理的利润情况 4 2018年与2019年各地区订单变化情况 5 2019年各地区销售经理销售情况 6 2019年各地区销售经理退货数 7 2019年各地区销售经理实际销售额占比 8 2019年各地区经理销售额完成情况 9 2019年各品类商品销售额贡献 10 2019年各品类商品地区销售情况 11 各品类商品的实际销量趋势 12 2019年各地区新老客户利润占比 13 2019年客户细分 14 2019年各地区客户分布
二、电商数据分析
- 全局概览
1.1 2018年至2019年各品类商品销售额情况
插入数据透视表,行标签为“订单日期”,列标签为“类别”,值为“销售额”,将数据展开至季度,如下表所示:
通过上述透视表,我们可以选择数据,插入堆积柱状图,用可视化形式表现我们的数据,下图为2018年至2019年各品类商品的销售额情况:
1.2 2018年至2019年各地区商品销量情况
插入数据透视表,行标签为“订单日期”,列标签为“地区”,值为“销量”,得到透视表如下图所示:
通过上述数据透视表结合日程表的使用,我们可以选择数据,插入簇状柱形图,用可视化的形式表现我们的数据,下图为2019年各地区商品销量情况:
1.3 2018年至2019年各地区经理的利润情况
插入数据透视表,行标签为“地区经理”,列标签为“年”,值为“利润”,得到透视表如下图所示:
此时插入簇状柱形图,我们会发现各地区经理利润增减无法通过上图轻易得出。故复制数据透视表,粘贴到其他单元格,添加辅助列“利润增长/减少”,此时我们可以选择数据——地区经理和利润增长/减少两列,插入柱状图,用可视化的形式表现我们的数据,下图为2018年至2019年各地区销售经理的利润情况:
1.4 2018年与2019年各地区订单情况
插入数据透视表,行标签为“地区”,列标签为“年”,值为“订单ID”与“订单ID2”,得到数据表为各个地区经理从2018年到2019年的订单情况。之后,选择2019年数据,如下图所示:
我们可以选择数据,插入组合图,用可视化形式表现我们的数据,下图为2019年各地区订单一览图:
如要进行对比分析,可以在同一表格中复制数据透视表,得到的数据表为各个地区经理从2018年到2019年的订单情况:
我们可以选择数据,插入折线图,用可视化形式表现我们的数据,下图为2018年与2019年对比分析图:
-
销售经理的kpi
2.1 2019年各地区销售经理销售情况
插入数据透视表,行标签为“地区经理”,值为“数量”、“销售额”及“利润”,筛选器为“年”,得到数据表为各个地区经理从2018年到2019年的销售额、销量与利润情况,如下表所示:
针对上图数据透视表,我们可以选择数据,插入组合图,用可视化形式表现我们的数据,下图为2019年的销售额、销量及利润数据情况:
2.2 2019年各地区销售经理退货数
插入数据透视表,行标签为“地区经理”,值为“退回数”,筛选器为“退回”,选择筛选器为“是”,将年份设置为切片器,得到2019年各个地区经理的退回数量,如下图所示:
选择分析,点击“字段、项目和集”,添加字段“退回均值”,退回均值为52,如下图所示:
针对上述数据透视表,我们可以选择数据,插入组合图,用可视化形式表现我们的数据,如下图所示:
2.3 2019年各地区销售经理实际销售额占比
插入数据透视表,行标签为“地区经理”,值为“销售额”和“销售额占比”,插入年切片器,得到各地区经理2019年的实际销售额及其占比,如下图所示:
针对上述数据透视表,我们可以选择数据,插入饼图,用可视化形式表现我们的数据,如下图所示:
如果我们想要绘制出瀑布图,首先需要把数据透视表中的“行标签”和“销售额占比”两列单独复制出来,如下图所示:
针对上图数据,我们可以插入瀑布图,用可视化形式表现我们的数据,如下图所示:
2.4 2019年各地区经理销售额完成情况
插入数据透视表,行标签为“地区经理”,值为“销售额”,将“年份”和“退回”为“否”放入筛选器,留下2019年的数据,假设各个地区销售经理的销售目标均如下图所示:
针对上图数据,我们可以插入堆积柱状图,用可视化形式表现我们的数据,如下图所示:
-
商品销售情况
3.1 2019年各品类商品销售额贡献
插入数据透视表,行标签为“类别”,值为“销售额”与“销售额占比”,将“年”和“退回”放入筛选器,得到数据透视表如下图所示:
针对上述数据透视表,我们可以选择数据,插入饼图,用可视化形式表现我们的数据,如下图所示:
3.2 2019年各品类商品地区销售情况
插入数据透视表,行标签为“地区”、“类别”、“子类别”,值为“数量”,筛选器为“退回”,将“退回”选择“否”,得到数据透视表(篇幅过长,这里不做展示)。选择设计,将报表布局改为重复所有项目标签,去掉+号。针对数据透视表,我们可以选择数据,插入旭日图,用可视化的形式表现我们数据,如下图所示:
3.3 各品类商品实际销量趋势
插入数据透视表,行标签为“订单日期”,列为“类别”,值为“数量”,筛选器为“退回”,将“退回”选择“否”,得到数据透视表(篇幅过长,这里不做展示。注意:数据透视表必须完全展开,才能够全部显示在图表中)。我们可以选择数据,插入折线图,用可视化的形式表现我们数据,如下图所示:
-
客户分布情况
4.1 2019年各地区新老客户利润占比
插入数据透视表,行标签为“地区”与“客户名称”,列标签为“年”,值为“利润”,筛选出2018年与2019年客户数据,采用if函数筛选出2019年新老客户,然后将2019年数据复制出来,采用数据透视表筛选出2019年新老用户利润分布情况如下图所示:
针对上述数据透视表,我们可以选择数据,插入饼图,用可视化形式表现我们的数据,如下图所示:
接下来,我们可以继续采用数据透视表筛选出2019年各地区新老用户利润分布,如下图所示:
针对上述数据透视表,我们可以选择数据,插入百分比堆积柱状图,用可视化形式表现我们的数据,如下图所示:
4.2 2019年客户细分
插入数据透视表,行标签为“客户名称”,值为“订单ID”与“销售额”,筛选器为“年”,将“年”选为2019,得到数据透视表(篇幅过长,这里不做展示)。针对数据透视表,我们可以选择数据,插入散点图,用可视化的形式表现我们数据,如下图所示:
4.3 2019年各地区客户分布
插入数据透视表,行标签为“地区”与“客户对象”,值为“客户名称”,筛选器为“年”,将“年”选为2019,选择设计,将报表布局改为重复所有项目标签,得到2019年各地区客户分布数据透视表,如下图所示:
针对上述数据透视表,我们可以选择数据,插入树状图,用可视化的形式表现我们数据,如下图所示:
三、总结
- 在电商行业中,面对多指标,大量的数据,数据透视表的使用将会大大降低我们的工作量;
- 数据透视表不仅仅可以用来汇总求和,还可以用来计数,求平均值、最大值、最小值、乘积、方差等;
- 切片器的使用,将会让我们的数据展示的更加有条理;
- 在面对大量数据的时候,数据透视表与图形的结合,将会大大提升数据的可读性。