大模型面试题汇总-基础篇
1. 目前主流的开源模型体系有哪些?
2. prefix LM 和 causal LM 区别是什么?
3. prefix LM 和 causal LM、encoder-decoder 区别及各自有什么优缺点?
4. 大模型LLM的架构介绍?
5. 大模型的Tokenizer的实现方法及原理?
6. 模型幻觉是什么? 原因、解决方案是什么?
7. ChatGLM3的词表实现方法?
8. GPT3、LLAMA、ChatGLM 的 Layer Normalization 的区别是什么? 各自的优缺点是什么?
9. 大模型常用的激活函数有哪些?
10. 多查询注意力与群查询注意力是否了解?区别是什么?
11. 多模态大模型是否有接触?落地案例?
12. llama输入句子长度理论上可以无限长吗?
有需要全套的AI大模型面试题及答案解析资料的小伙伴,可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费
】