个人情况
先说一下个人情况:
- 学校情况:211本中9硕,本硕学校都一般,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习
- 论文情况:2A(NeurIPS+AAAI)+1B(ICDM)已录用,以及一篇数据挖掘A刊TOIS在投,四篇论文都是一作
- 实习情况:快手推荐算法日常实习 + 腾讯大模型暑期实习
- 奖学金情况:本科生国家奖学金、研究生国家奖学金,4次校级一等奖学金
- 其他:我的CSDN还有公众号以及知乎之类的,这些平台都有一点粉丝量,至于其他诸如数学建模还有蓝桥杯获奖,以及优秀毕业论文和优秀毕业生之类的,对求职也没太大作用
蔚来没有发意向,而是直接开奖了,SSP的价格,有一些股票,综合考虑后已经拒掉了
一面/技术面 1h
- 自我介绍
- 挑一个实习介绍
- 了解哪些位置编码技术
- RoPE原理
- 线性内插、NTK、YaRN
- 位置编码内插后注意力计算会增加,如何缓解
- 介绍LongLoRA
- 数据集构建时各种类型数据的比例是如何确定的
- 使用华为910B及其相关平台时有遇到哪些困难,如何解决的
- 效果如何评测的
- 最终的效果提升有没有具体的指标
- Coding:两数之和
- 为什么要投蔚来
- 反问
二面/技术面 1h
- 自我介绍
- 介绍实习
- 做了哪些工作,mentor提供了哪些支持
- 介绍LongLoRA
- YaRN原理
- 主要业务场景
- 训练过程中如何降低显存使用
- 训练的细节,时长,参数设置,显卡数量
- 如何观察训练是否生效
- 介绍快手实习
- 全链路介绍,怎么做的推荐
- 做了哪些工作
- 找工作时更看重哪些
- 秋招进度
- 反问
三面/技术面 1h
- 自我介绍
- 对自己的规划,车企和互联网企业选什么
- 询问转正情况,base地选择
- 介绍实习,相关业务背景
- 新数据来临后需要重新训练么
- 剧本或者小说里边高潮部分如何判断
- 项目情况,人员分工
- 从业务角度来看,哪些指标很关键
- 一般会从哪几个角度判断内容好坏
- 长文本扩展技术介绍,长文本的首token出现时间
- 为什么不用腾讯内部的混元,了解过混元的基础原理之类的吗
- 如何保证模型长度扩展后的效果,效果如何评测
- 实习完有什么收获,从大模型本身来讲,学到了些什么东西
- 开放设计题:如何让大模型做函数调用
- 硕士期间实验室研究方向,介绍NIPS论文
- 论文的最大价值,效果如何验证的,提升了多少
- 毕业后想从事的方向
- 写博客、公众号还有github的动力是什么
- 哪篇文章的点赞最多,印象最深的读者反馈是什么
- 做科研和项目过程中,最大的挑战是什么,如何去解决的
- 写博客等习惯对你后续有什么帮助
- 遇到的最大的挫折是什么,怎么解决的
3面后过了一分钟就是HR面,感觉3面也夹杂了一些HR面的内容,所以HR面问得比较少
四面/HR面 10min
- 转正相关情况
- 团队协作经历
- 实习期间有没有相关的合作经历,具体介绍一下
- 反问:后续流程