Bootstrap

蔚来 2025届秋招 大模型工程师

个人情况

先说一下个人情况:

  1. 学校情况:211本中9硕,本硕学校都一般,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习
  2. 论文情况:2A(NeurIPS+AAAI)+1B(ICDM)已录用,以及一篇数据挖掘A刊TOIS在投,四篇论文都是一作
  3. 实习情况:快手推荐算法日常实习 + 腾讯大模型暑期实习
  4. 奖学金情况:本科生国家奖学金、研究生国家奖学金,4次校级一等奖学金
  5. 其他:我的CSDN还有公众号以及知乎之类的,这些平台都有一点粉丝量,至于其他诸如数学建模还有蓝桥杯获奖,以及优秀毕业论文和优秀毕业生之类的,对求职也没太大作用

蔚来没有发意向,而是直接开奖了,SSP的价格,有一些股票,综合考虑后已经拒掉了

一面/技术面 1h

  1. 自我介绍
  2. 挑一个实习介绍
  3. 了解哪些位置编码技术
  4. RoPE原理
  5. 线性内插、NTK、YaRN
  6. 位置编码内插后注意力计算会增加,如何缓解
  7. 介绍LongLoRA
  8. 数据集构建时各种类型数据的比例是如何确定的
  9. 使用华为910B及其相关平台时有遇到哪些困难,如何解决的
  10. 效果如何评测的
  11. 最终的效果提升有没有具体的指标
  12. Coding:两数之和
  13. 为什么要投蔚来
  14. 反问

二面/技术面 1h

  1. 自我介绍
  2. 介绍实习
  3. 做了哪些工作,mentor提供了哪些支持
  4. 介绍LongLoRA
  5. YaRN原理
  6. 主要业务场景
  7. 训练过程中如何降低显存使用
  8. 训练的细节,时长,参数设置,显卡数量
  9. 如何观察训练是否生效
  10. 介绍快手实习
  11. 全链路介绍,怎么做的推荐
  12. 做了哪些工作
  13. 找工作时更看重哪些
  14. 秋招进度
  15. 反问

三面/技术面 1h

  1. 自我介绍
  2. 对自己的规划,车企和互联网企业选什么
  3. 询问转正情况,base地选择
  4. 介绍实习,相关业务背景
  5. 新数据来临后需要重新训练么
  6. 剧本或者小说里边高潮部分如何判断
  7. 项目情况,人员分工
  8. 从业务角度来看,哪些指标很关键
  9. 一般会从哪几个角度判断内容好坏
  10. 长文本扩展技术介绍,长文本的首token出现时间
  11. 为什么不用腾讯内部的混元,了解过混元的基础原理之类的吗
  12. 如何保证模型长度扩展后的效果,效果如何评测
  13. 实习完有什么收获,从大模型本身来讲,学到了些什么东西
  14. 开放设计题:如何让大模型做函数调用
  15. 硕士期间实验室研究方向,介绍NIPS论文
  16. 论文的最大价值,效果如何验证的,提升了多少
  17. 毕业后想从事的方向
  18. 写博客、公众号还有github的动力是什么
  19. 哪篇文章的点赞最多,印象最深的读者反馈是什么
  20. 做科研和项目过程中,最大的挑战是什么,如何去解决的
  21. 写博客等习惯对你后续有什么帮助
  22. 遇到的最大的挫折是什么,怎么解决的

3面后过了一分钟就是HR面,感觉3面也夹杂了一些HR面的内容,所以HR面问得比较少

四面/HR面 10min

  1. 转正相关情况
  2. 团队协作经历
  3. 实习期间有没有相关的合作经历,具体介绍一下
  4. 反问:后续流程
;