Bootstrap

【字节跳动】数据分析师面经

【字节跳动】数据分析师面经

感想

首先要感慨一下字节跳动分析师的面试是我遇到过的相当专业的面试经历,因为也只经历了一面,考察的偏业务,不知道经历二面三面的同学是不是考了更多的统计学和模型相关的问题。

这次面试考察面试者解决问题的能力与是否全面,虽然看了很多面经,大致的问题是有一个概念,但完全没有料到,会问的这么细致,以及你抛出答案的同时就必须得有实现的方法,不然都是白搭,所以先在这里希望看官可以做好全面的准备,不要报侥幸心理,祝好运的话我就不说了,好运只属于有准备的人。到目前我都不知道我的答案是否准确,哪里可以改进,如何改进。我发出来也是希望借各位大牛之力能帮我解决这些问题,以及如何想面试官还会问什么问题?避免就算找到这次面试问题的完美答案,抛一个新的问题来又不知道怎么解决?废话不多说,我们进入正题!

自我介绍&过往经历

这里面试官只让我提出来一个项目讲,可能我讲的项目面试官接触不多,问的不是很细,但是自己也是准备了逻辑完全可以自洽的项目去说,所以各位准备自己的项目的前前后后也是要想清楚,避免逻辑错误,面试必考题每个人的公司项目不同,我也就不说了。

面试正题

这里的问题我的回答不太过关,如果我找到合适答案,再更新进来。同时把自己内心独白和思考过程引出来,有问题欢迎来反驳,相互进步!

问题1:你最常用的app是?
:微博

问题2:让你给微博搭一套指标体系给各个业务线vp看你会怎么搭?

平台指标:DAU、模块点击量、博主数、发帖量、点赞、评论
渠道指标:各个渠道的广告投放
用户指标:留存率、频次、停留时长
觉得合理的答案:有问过周围的同学,提到一个模型AARRR,觉得挺全面的,这里贴出链接

问题3:平台发起明星挑战活动,让你评估效果你怎么评估?
:明星的发帖量、用户的发帖量、用户的评论点赞,如果是关联到收入,可以看下这个活动带来的B端收益,以及细节指标像是各个模块的点击参与情况。

问题4:如果做发帖量的预测我你怎么做?

我有看过很多人提到说用留存率去算,但是觉得这个丢失了一个自循环和周循环的因素,所以没选择这个解法,这里也抛出别人用留存率预测的链接

:时间序列中的ARIMA模型,用自循环率(AR-Auto Regression)和7天的周期(MA-Moving Average),在被问到留存率的时候,我意识到面试官想要用留存率去算,我又解释这个可以用幂函数拟合一个留存率,然后预测明天的留存率用今天的发帖乘以第1天留存率+昨天发帖*第2天留存率,以此累加。

现在想来这个模型好像能解决周循环和自增的问题,不确定,总觉得笨笨的,但是也没有什么特别好的方法,现实里面是真的这么运用的么?

问题5:如何加入运营动作以及其他影响到这个模型里面?
:(自己也不确定怎么加)直接累加到上面的预测模型。

问题6:你觉得预测DAU和发帖量是一个模型吗?
:(我想了想很相似)是的。

所以到底是不是一样,求解答

问题7:让你去找发帖量与DAU之间的关系你怎么找?
:(当时被细致连问问懵了,其实自己想表达的是coefficient,都不知道自己在说啥)相关性测试、看斜率的相关性,0是不想关,1是正相关。

问题8:如果现在有一些人直接复制别人的内容发出来,或者发出来的内容质量不高,让你定一个策略出找出这些帖子,你怎么找?

后面被问让总结补充这个策略模型,可能我说的太乱,也不太全的缘故

:ip地址是否异常,发帖是否太迅速,与其他贴的重复率是否很高。

问题9:这个模型或者策略让你用一个指标去衡量表现,你用什么?现在让你做ABtest,你怎么做?
:(我把abtest解释了一通,发现他关心的是评价的指标)预测准确率

问题10:现在你怎么对这个abtest分组?怎么取样?
:均匀分配,全量抽样

问题11:全量抽样,现在抽样上来只有1%不到的样本是劣质的,你还全量抽样?
:扩大抽样样本,从疑似的里面抽

问题12:这个策略上线,发现DAU下降了,你觉得是否有关?
:并不一定,如果说这个策略上线误判率很高,也就是当中是优质的帖子被大量删除,抑制了用户发帖,帖子减少,DAU可能随之下降,如果说有效遏制了劣质的帖子的发送,让用户看到更多优质内容,体验提升,对DAU是有利的

问题13:如果这个模型误判率也很低,还有其他可能会影响的因素吗?
:如果准确率也很高,误判率也降低,那0-1分类模型里面的四种情况都有效预测出来,那可以推断DAU下降与模型无关

现在想是不是需要提供模型外部的影响因素?

问题14:如果DAU异常监控追因的看板你怎么搭?

外部:政治、运营产品动作
内部:前面一开始搭的看板,从分渠道、分城市、分产品线来监控。

最后就问你还有什么问题?我简单问了几个组织架构,所需负责的内容的问题,这些问题都是万金油的存在。中间还有很小部分细节问题在答的同时伴随出来的我也记的不是很清晰了,大的问题框架是这样的。

整个面下来反思自己思考问题有点挤牙膏,问一点答一点,短时间内拟大框架的能力还是欠缺,经验不足,还是有很多提升的地方,也有可能是压力面,面试官很喜欢问还有吗?有几个地方我就没还有出来,所以菜鸟这里诚心的向各位大佬发问,这些问题如果是你你会怎么解呀?人凑一问,让我们这些大厂外圈摸爬的人可以快速成长,早日入圈!(跪谢)

;