1.数据分析师最重要的能力是什么?能够给企业带来什么?
- 量化业务:指标体系——基础是了解全流程,全业务线的业务
- 分析市场和行业趋势:生态链,业务模式,竞品,产品发展方向
- 利用数据技术解决业务难题:决策类,分类/精细化策略,销转链路的优化
2.项目怎么写?(项目是一个星期都解决不了的业务难题)
项目背景
- 主要说明这个项目为什么必须要解决,说明做项目的必要性,突出问题很重要,问题很难
- 业务的业务逻辑是什么?按照这个逻辑解决这个问题应该从什么方向入手(可以不写入简历,但是一定要在准备项目的时候写清楚)
项目的逻辑
- 为什么必须选择方案A?强调A方案的必要性,说明为什么别的方案不行
项目的主要策略/目标
- 体现问题的拆解思路
- 体现你对于目标的量化能力(是数据分析师的核心能力)
项目的主要工作是做了什么?什么工作是在这个项目中起决定性作用的
- 写出关键的策略,以及策略的效果
- 介绍主要的方案与方案的逻辑
- 把监控数据,分析数据之后做了什么策略优化说明白
- 说明项目中最能体现难的技术或者业务思考(模式,策略,方法的改进)
项目的业绩
- 从量的提高到质量的优化再到销售额的提升
- KPI的直接效果
- 对核心目标的效果
3.面试要表达什么内容?
- 我能胜任岗位:不是表达自己在以前的岗位做得多好,而是提炼方法论,抽象出模式,然后套用到新的工作上去,在此基础上再表现自己很优秀
- 我愿意来贵司上班:我对您的工作有好奇
- 我能让您愿意与我共事
- 关键问题要尽量答的又全面又好,不关键的问题要尽量准确简洁,需要控制好面试的节奏
- 如果简历里的干扰项(与被面岗位无关,容易让面试官分心的内容)太多,面试的节奏就不容易把控好
4.未来规划问题怎么答?
- 关键点:我的未来规划是想要在贵公司长期效力的
- 公司所在行业的长远发展的预期
- 岗位的长远发展的预期:岗位短时间能够给公司带来什么价值?长期能够带来什么价值?
5.业务细节没做过怕露馅怎么办?
- 指标体系,是日常观察到的业务情况
- 梳理明白:客户从哪里来?企业如何引导客户消费?消费之后的客户是否需要维护?如何服务与维护?销(营销)转(转化)链路
- 通过多次面试来优化,多演练几次,找人看其中的逻辑错误
6.如何准备面试?
- 找一个目标JD
- 拆解JD关键词
- 查漏补缺
- 找与目标JD相似的JD,拆解JD,并仿写简历,投递试手(能够避免被大厂拉黑,大厂都有面试评价系统,说明为什么会拒绝/通过这个面试者,会影响面试官第一印象)
- 优化简历,优化自我介绍和项目介绍的话术
7.如何找招股说明书?
招股说明书会介绍公司的业务,业务规模,行业的模式,市场规模等关键数据,对理解公司的业务很有帮助(没有上市的公司只能通过公司所在行业,搜索行业研报来侧面了解以上信息)
- 搜索公司上市的交易所
- 到交易所的官网,搜索公司名称
- 找公司的招股说明书
8.怎么谈高薪?
- 准备好每一场面试,尤其是倒数第二面的高管面试,可以提前去搜索高管对于公司发展的一些公开演说和访谈,了解产品定位和产品展望
- 一定要提前了解企业所在的行业情况
- 多面试多拿offer
9.怎么打开一个市场?
- 目标
- 搭建团队
- 跑通业务
- 占领市场
- 提升细分市场满意度
- 商业化
10.工作经验
对日常工作的理解
- 业务模式
- 业务目标:企业赚的是什么钱,用什么流程,什么方法赚钱
- 日常绩效
对工作难题的理解
- 解决问题的必要性(问题的挑战难度)
- 解决问题方案的必要性
对行业的理解
- 行业大盘有多大?
- 行业的生态是什么样的?
- 行业里参与的竞对有哪些?
- 竞争模式一般是什么样的?
11.自我介绍应该怎么做?
- 简短地介绍自己的工作经历和学历
- 说明自己与目标岗位匹配的工作内容:①需要介绍自己所在企业的业务模式 ②需要介绍自己所在部门的业务与整个企业的业务模式的匹配情况
- 强调自己很优秀
12.类比问题
你的业务有A场景,我的业务也有类似的场景,我把我的场景举例出来,你说说你对这个场景的解决方案
- 面试者:我在做立项的时候,参考了公司内部的问卷调查系统的结果
- 面试官:你在收集问题的时候有没有水军,你是如何考虑的?
- 错误答法:我没有遇到过这样的情况
考察的是你对于技术场景的知识积累,也考察你对于问题的拆解(思考能力)和解决能力
如何回答?
- 首先这个问题我是如何拆解的?遇到这个问题,可能有什么情况(只给一个答案基本只能得一半的分数)压力面的一个重要的点在于对于问题的拆解是不是符合MECE原则
- 我是如何针对具体的拆解结果去设计方案的?
- 我是如何为这些方案去设计考核指标的?
13.面试如何保持节奏/状态?
- 集中注意力:听明白问题
- 少出差错:想明白了再回答
14.随机抽取好还是全局抽取好
- 对于自己公司里的审核人员做问卷调查
- 如果能看到总体的情况,肯定是总体更好
考虑点:
- 这两个选择对于公司意味着什么?
- 哪个能提高效率?
- 哪个能提高业务质量?
- 哪个能节约成本?
15.什么决定实验的样本量大小?
- 在于H0的置信区间的设置
- 5次和3次如果算作显著差别:A
- 5次和1次如果算作显著差别:B
- A和B的样本量是不一样的
16.你最喜欢用的产品?
- 业务模式,盈利模式,生态链
- 快手:是通过链接视频生产者和视频消费者的平台
- 快手的生态链是从视频生产者,包括普通视频生产者UGC和专业视频生产者PGC和其MCN机构组成;平台连接的是广大国内短视频用户群体。用户通过平台消费视频生产者生产的短视频,直播内容。广告商通过平台广告投放,平台能够赚取广告费用,电商企业通过平台直播带货,平台能够收取直播服务费用
- 整个平台的近期主要目标
- 做短视频市场的有:抖音
- 整个短视频用户规模:8亿左右,创作者规模,广告规模
- 现在基本上是处于一个存量时代,产品之间的竞争体现在对于用户 / 创作者 / 广告主的争夺
规模怎么知道有多大?
- 行业分析报告:QuestMobile,艾瑞(互联网)
- 看行业的咨询公司是否有公开报告?有一个APP慧博投资分析每天打卡可以免费下载行业报告
- 看行业的近期IPO的公司发出的招股说明书,有行业的概述部分
17.如果让你改进这个产品,你会如何改进?
- 背景:介绍为什么必须改进这个点?
- 目的:解决这个问题能够获得什么?
- 方案:必须要采用的方案有哪些?解决的是哪些拆分出来的问题?
18.现在要你写一个品牌的前三季度报告,怎么写,有框架吗?从哪些方向写?
- 品牌的目标是什么?在理解目标的基础上,才能知道哪些大的指标是有用的,哪些是不那么重要的
- 品牌为达成这个目标做了什么方案?评估方案的有效性
- 品牌的具体团队为这个方案做了什么具体的工作?评估工作的绩效
- 如何达成目标?第四季度应该做什么改进?
19.针对不同的行业要写不同版本的简历吗?
- 针对同一个公司不同的JD都要写不同的简历,不要偷懒
- 项目也需要根据JD做调整
20.给你两周时间,写一份陌生行业的分析报告,你会怎么做
- 行业基础研究的目录层次:基础知识,经营环境,市场特征,商业模式分析,产业链,业内主要企业,未来发展趋势,成功融资案例,行业评价
21.面试流程
电话面:判断合格(HR,主管)工作经验和项目
技术面:口试SQL,估算问题
业务面:项目,面试作品(主管,导师,leader)(很多人在这一面挂)
交叉面:逻辑
HR第一次面:常规面
HR第二次面:谈薪
22.数据分析流程是什么样的?
提出问题→理解数据→数据清洗→构建模型→数据可视化
第一步:数据准备(70%时间)
- 获取数据(爬虫,数据仓库)
- 验证数据
- 数据清理(缺失值,孤立点,垃圾信息,规范化,重复记录,特殊值,合并数据集)
- 使用Python进行文件读取csv或者txt便于操作数据文件(I/O和文件串的处理,逗号分隔)
- 抽样(大数据时,关键是随机)
- 存储和归档
第二步:数据观察(发现规律和隐藏的关联)
- 单一变量:点图,抖动图;直方图,核密度估计;累积分布函数
- 两个变量:散点图,LOESS平滑,残差分析,对数图,倾斜
- 多个变量:假色图,马赛克图,平行左边图
第三步:数据建模
- 推算和估算(均衡可行性和成本消耗)
- 缩放参数模型(缩放维度优化问题)
- 建立概率模型(二项,高斯,幂律,几何,泊松分布和已知模型对比)
第四步:数据挖掘
- 选择合适的机器学习算法(蒙特卡洛模拟,相似度计算,主成分分析)
- 大数据考虑用Map/Reduce
- 得出结论,绘制最后图表
循环第二步到第四步,进行数据分析,根据图表得出结论完成文章
23.业务分析怎么进行?
①数据为王,业务是核心
了解整个产业链的结构
制定好业务的发展规划
衡量的核心指标有哪些
有了数据必须和业务结合才有效果。首先你需要摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。然后根据业务当前的需要,制定发展计划,从而归类出需要整理的数据。最后一步详细地列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握非常重要
②思考指标现状,发现多维规律
熟悉产品框架,全面定义每个指标的运营现状
对比同行业指标,挖掘隐藏的提升空间
拆解关键指标,合理设置运营方法来观察效果
针对核心用户,单独进行产品用研与需求挖掘
发现规律不一定需要很高深的编程方法,或者复杂的统计公式,更重要的是培养一种感觉和意识。不能用你的感觉去揣测用户的感觉,因为每个人的教育背景,生活环境都不一样。很多数据元素之间的关系没有明显的显示,需要使用直觉与观察(数据可视化技术来呈现)
③规律验证,经验总结
发现了规律之后不能立刻上线,需要在测试机上对模型进行验证
24.数据分析框架是什么样的?
①从互联网实体角度分析
我们可以从以下7个角度构建互联网数据分析体系
- 买家:基本特征分析,交易行为分析,流量行为分析,售后满意分析等
- 卖家:基本特征分析,经营效果分析,流量曝光分析,售后满意分析,产品分析等
- 产品:基本特征分析,交易行为分析,流量曝光分析,售后满意分析等
- 行业:基本特征分析,经营分析,曝光分析,售后分析,产品分析,买卖家分析等
- 设备:移动端分析,PC端分析,访问对象分析,cookie分析,session分析等
- 日志:访问对象URL分析,cookie分析,session分析等
- 事件:登录,流量,点击,曝光,下单,交易,支付,物流,评价,纠纷,仲裁等分析
这个实体分析方法,可以称得上是万能的数据分析框架,适用于所有互联网企业。
②从用户的关键路径进行分析
关键路径分析方法是一个行之有效的常用分析方法,也是做数据化运营的常用工具。关键路径分析让我们聚焦于核心环节,排除杂音,定位出业务的核心问题,快速的加以解决。在应用关键路径分析时候,我们往往先把可能的结果,以及最关心的结果梳理出来,以结果为导向追溯行为的根本,当然,也可以从行为的初始出发,梳理出所有可能的行为路径,找出关键行为,导向我们最终设计好的结果中去,下面我们举例子说明下:
在电商网站中,我们假设我们运营目标是让用户购买网站上的商品(在这里,我要插说几句,我们的目标有时候不只是购买,在精细化运营中,往往会根据用户的生命周期,确定关键路径的目标,比如对于一个进入期的新买家,我们通常会发一些购物攻略加以指导,针对流失期的买家,关键路径的结果我们可能导向申领我们的优惠券之类等等。)刚才谈到,我们假设我们运营目标是让用户购买网站上的商品,那么我们可以把关键路径,也即,用户的购买路径梳理出来:
- 用户登录/注册→搜索关键词→查看商品详情→加入购物车→点击下单→确认付款→确认收货
- 用户搜索关键词→类目和店铺→卖家交流→点击下单→确认付款→确认收货
通过这种关键路径,我们还常常进行漏斗分析,从而进行流量的转化分析,找出影响到达最终结果的关键环节
③从KPI拆解角度分析
KPI拆解分析方法也是比较常见的互联网分析方法。核心思想是先定一个总体目标,比如今年营收12亿,那么可以把这个指标拆解到各个业务线去,业务线再进行拆分,比如分解为12个月,每个月需要达成营收额,接着,就是达成该营收额,根据流量的转化情况,估算出需要多少的流量,目前平台已有多少流量,需要外拓引流多少流量才能达成目标,这就可以层层拆解指标,最终或落地到产品团队或部分导运营团队去承担KPI任务
25.面试官看重的要素
①数据分析技能
②分析报告:为业务(产品,市场,运营)提供有洞察力的数据分析报告及策略建议,为业务决策,市场方向提供有价值的数据支持
③项目经历:做过XXX分析模型(详细解释,附带作品),XXX分析报告(详细解释,附带作品)(推荐找一个感兴趣的产品(竞品),写一个完整的产品分析报告,作为作品附在简历中,报告观点自洽,并且具有结构化体系)
④掌握数据分析体系方法
⑤演说,演讲技能
26.对细节的敏感度
①统计口径
- 统计口径一致是确保数据可比性的基础
- 比如转化率,是点击率转化还是注册算转化还是购买算转化?
- 配送时间,是从用户下单开始计时还是从订单确认开始计时还是从商品出库开始计时
- 客单价包不包括配送费,打包费,代金券形式的折扣优惠
②数据
对数据异常波动,离群值,平均数没有代表意义等情况的迅速识别能力
27.去互联网,金融,零售行业做数据分析师都要掌握哪些工具?
①商业问题的理解
方法论:swot,pest,5w2h,mece原则,二八原则等
PPT:给领导或者小组内做一些简单的交流
WORD:把自己分析目标的内容说清楚
Xmind:传达自己的分析思维
②数据的采集
内部采集:SQL
外部数据采集:爬虫(python),第三方工具(八爪鱼)
③数据的处理与分析
Excel:数据量小
python:数据量大
④数据的呈现
Excel
tableau
⑤汇报与复盘
PPT
28.流量分析的核心思维
常见的流量波动分析就是两个:日活和留存
①日活
日活波动=外部影响 & 内部影响
外部影响 = 行业变化 & 竞品变化 = 常识 + 外部事件 + 竞品策略
内部影响 = 数据统计 + 用户基础属性 + 用户行为属性
数据统计:数据没有搞错 —— 数据采集和统计口径
用户基础属性:用户从哪里来,通过什么方式进入 —— 渠道(新增用户变化)入口,画像
用户行为属性:用户进来干了什么 —— 具体功能的变化,跟版本可能有关
②留存
留存波动=新用户留存&老用户留存
新用户留存=渠道+渠道过程有关
老用户留存=所有功能用户去重留存+大盘非功能用户留存
实际中,会出现以下几种情况(假设留存下跌):
A,B,C中有1个留存下跌 —— 最好解释
A,B,C中有两个以上留存下跌 —— 看谁是主要下跌因子,找到它,如果下跌幅度都差不多:
1)进一步观察,如果还是持续阴跌,必然是产品某核心部分出现问题,围绕指标体系做一次产品全盘分析,找到它
2)跌了几天之后回去了,可能跟外部影响因素有关,暂时不管
在留存这件事上,由于是比例,排查起来会比较费神,保持耐心,跟业务多聊,一定能够找到主要影响因子
29.以京东APP为例,讲解电商数据分析
①如何去看京东APP
1)用户视角
搜索:流量最大的一个入口
广告banner:各种活动宣传
导航:十宫格,相对比较稳定,10大主要产品
feeds流:电商 + 内容
个性化推荐:千人千面
底部button:5大主模块,方便快速查看
2)数据分析师视角(应该更加深入有层次地去看这个APP的数据)
有三个问题需要大家思考
引流(场):首页作为最大的带量位,分发效率怎么评估
漏斗(货):北极星指标交易额只是一个数字,更加重要的是理解这个数字转化的过程
用户(人):作为一款非常成熟的APP,老用户相对比较稳定,但新用户获取应该怎么优化
其中引流是对整个APP整体的分析,漏斗是对核心路径的分析,用户是对产品的当前痛点进行分析
②首页的分发效率
除了要关注日活,留存,渗透率这些常规指标外,更加重要的是找到一些能够反映产品问题的指标
CTR:点击UV/曝光UV,反映用户点击欲望的指标,非常重要,只有点击才能产生交易,如果较小,首页问题较大
人均访问(点击)页面数:总访问页面数(PV)/总访问UV,只有多访问页面,才可能产生交易
而围绕这两个指标,按照维度拆解方法,可以发现更多问题
比如CTR突然低了,那么是所有坑位的CTR均低还是个别引起
基于日活,留存,渗透,分发效率,基本上就能够对APP的整体数据有个大概了解
作为一名优秀的分析师,除了要把自己负责的产品做好外,更加重要的是不要设定边界,主动去了解整体数据,在这个过程中,你需要找到负责的产品跟大盘的数据关系
A.该产品确实很好的带来了大盘的提升
B.该产品只是在抢大盘的流量
C.该产品部分抢大盘流量,部分提升,那么提升度到底多少
找到:业务功能与产品核心指标的关联性,量化
③漏斗分析
了解每层漏斗的影响因素:请教老同事,买电商书籍查看,多机型体验产品
引流渠道:桌面图标打开进入搜索还是其它搜索框搜索,热点搜索,语音搜索
客服,评论,店铺设计,商品属性
尺寸,颜色,数量
物流,是否只是7天无理由退货,发票,运费支付方式多样性
密码错误,冲动消费,界面异常,其它打断
应该说电商的大部分数据分析都会跟漏斗有关,除了经验之外,更加重要的是对产品本身的多体验,以及对竞品的学习,保持好奇心和敬畏心,也只有这样,才能慢慢关注到其他同学关注不到的点,而这些是培养良好微观体感的重要一步
④新用户分析
1)背景
作为一款非常成熟,在一线城市有很多忠实用户的APP,当前在用户体量上与手淘相差仍然很大,因此我们会看到京东与各方APP战略性合作,共同拉新
拉新必然就要衡量拉新效果和拉新优化,拉新效果内部数据不太清楚,但是作为一名分析师,可以去看整个APP在拉新上可以优化的点。实际上拉新如果做得好,比老用户分析更容易出成绩
2)建议
新用户和老用户相比,由于对APP不熟悉,因此在漏斗环节,可能会有几个特征:
A.用户行为较为离散化,数据上可能有几个主要漏斗
B.在某个环节转化率远比老用户低
C.新用户当天以逛为主,不下单,过一定时间段后再下单
数据分析师能做的就是:把自己当做一个新用户去体验各种路径,并对异常漏斗进行维度拆解(比如,是不是某个渠道的新用户转化率低引起整体低)
3)总结
对于一款电商APP,分发效率是非常重要的一个产品指标
漏斗模型套路很重要
新用户的分析会更加有挑战性和有趣感
30.以斗地主为例,看看如何做游戏行业的数据分析?
①背景
电商:非常互联网
互联网金融:直接跟钱打交道
游戏:互联网思维+钱都要具备
游戏行业用户两极分化比较严重:要么快速流失,要么就玩得时间很长
目标:尽量让用户晚点流失(流失分析),让花时间的用户多变现(商业分析)
②指标口径
日活:每天打开APP的用户数
次留率:第一天打开欢乐斗地主并且第二天也打开欢乐斗地主的人数/第一天打开欢乐斗地主的人数
渗透率:进入商城的用户数/DAU
转化率:针对某个连贯路径,使用下一个结点的用户数/使用上一个节点的用户数(打开APP - 进入房间 - 参加比赛)
③用户流失分析
行业内一般对流失用户的定义:一个月内不使用产品即定义为流失
实际上,不同的产品形态用户行为差异非常大,像住宿类APP那就是低频高价值用户,欢乐斗地主7天不上线可能就已经流失,所以要合理定义流失用户,对于流失用户,发现的越早越好
不能很好地定义流失就是因为用户有可能回流,比如拍脑袋30天,结果30天的时候,大量用户回流
所以实际上流失周期确定=回流率稳定,一旦这个指标稳定,就定义这个时间段天数为用户流失周期
回流率=回流用户数/流失用户数=某个周期内的流失用户数在周期结束后又回来了/某个周期内的流失用户数
所以,只要按照枚举法,周期=1,2,...30,然后分别计算回流率,一旦回流率趋于收敛,该周期就是流失周期
对于游戏行业的用户流失分析,即有其他行业的类似套路但又有一些差异化很大的点
类似套路:看流失前最后一步在干啥
差异化很大的点:作为一款非常复杂,需要花用户大量时间的APP,分析师要想好好研究用户为何流失,也必须要去很深入的玩游戏,找到游戏中的快感和痛点,跟其他玩家多交流,否则就是脱离业务
对于游戏分析(特别是网游),要结合游戏深入体验和初步数据一起分析,才能有明显效果
④付费分析
游戏这个行业前期投入大,本身迭代快,所以对付费变现有非常高的要求
在付费分析上,整体思路是:
A.以付费金额分布和付费模块为切入点
B.根据1确定未来重点是在高,中,低哪个群体
C.进行AB测试,并每天看收入情况
游戏行业非常注重收入,分析师要每天看收入数据,所做的各种分析都要和收入挂钩,除了互联网那些分析方法,游戏行业更加注重分析师的深度体验,单纯的数据只能解决交互式的失误,而不能让游戏变得更加好玩,所以分析师最大的价值就是让用户玩的更爽,只有到这一步,才能实现真正的增长
31.什么叫懂业务?
①原因:要知道业务流程是如何产生数据,要知道在每个业务的流程环节是如何使用数据的,每一个业务流程的变化对数据产生的影响有哪些
②方法:要懂行业,要懂企业,要懂得这个企业的组织架构,要懂得每个人在企业里面扮演的角色
懂行业:来龙去脉,盈利模式,服务的对象
理解公司:产品,服务的对象,对象和产品之间通过什么样的方式,管理者
业务的落地执行:企业级的部门有多少,部门职责,每个部门有多少人,每个人负责什么事情,这些事情都有哪些重要的环节
32.什么是一名合格的数据分析师?
①描述性分析:表格,图表,仪表盘
数据的准确性
掌握数据清洗可视化的能力
有构建业务指标体系的能力
②诊断性分析:对数据做出预判
数据的敏感度
逻辑思维能力:分析问题的框架
数据分析的方法
③预测性分析
掌握一些核心的算法能力:统计学,机器学习,深度学习
强大的编程能力
强大的算法掌握能力
业务抽象建模能力
④指导性分析:价值最高,难度最大
分析问题解决问题的能力
业务认知/构建的能力
执行和复盘的能力