AI 的发展速度实在是太快了,每天、每个月都有大量新的信息。你可能在刷公众号、小红书、短视频时,看到很多关于 AI 的推送:昨天马斯克开源了 Grok,今天阿里开启了通义灵码的内测,明天 KimiChat 又开启了 200W 上下文的模型内测,Suno.ai 3.0 的生成音乐质量大大提高……但信息量巨大且复杂,让人难以入手,最终变成了信息焦虑。
本文将帮助你理解 AI 的价值,并提供一套学习 AI 的系统方法。
AI 有什么用?
人工智能(AI)是一项源于 20 世纪 50 年代的技术,但直到 2006 年深度学习的提出,AI 才真正进入人们的视野。如今,生成式 AI(Generative AI)已成为焦点,它能够基于已有数据生成新的内容,如文本、图像、视频和音频。
生成式 AI 按照内容生成的方式可分为以下几类:
- 文生文:ChatGPT、Claude、文心一言等大语言模型,通过文本提示生成文字内容。
- 文生图、图生图:如 Stable Diffusion 和 Midjourney,输入提示词生成图片。
- 文生视频:OpenAI 的 Sora 和 Stable Video Diffusion(SVD),生成视频内容。
- 文生音频:TTS 技术用于语音合成、音乐生成等。
生成式 AI 技术的成熟度目前依次为:文生文 > 文生音频 > 文生图 > 文生视频。如果你的生活或工作中不需要这些技术,可能暂时不需要 AI;如果你对 AI 感兴趣,下面我们来探讨如何学习 AI。
如何进入 GenAI 这个新范式
生成式 AI 是一种新的「范式」,指科学共同体在某个时期内普遍接受的一套科学理论、实验方法和规则。
如何进入一个新的领域
在进入一个新的领域时,最重要的是有一张地图。对于 AI 领域的新手,这张地图包括 AI 的发展历程和当前热门方向:
1. 文生文
2. 文生图
3. 文生音频
4. 文生视频
了解这些方向的热门产品,并进行基础了解和试用。
最小必要知识
进入任何一个新领域的学习,都是由浅入深的。每个领域都有「最小必要知识」。在 AI 领域,我认为生成式 AI 的原理和使用是最重要的。了解并应用大语言模型和稳定扩散技术,可以快速超越大多数人。推荐学习资源包括 Jimmy 的入门课程,内容涵盖:
- 结构化编写 ChatGPT 的提示词
- Stable Diffusion 的原理
- 使用 Midjourney 和 Stable Diffusion 生成图片
-课程链接:
新手村的打怪任务
掌握了最少必要知识后,你需要完成一些初级任务来实践所学:
1. 用大语言模型生成内容:文心一言、通义千问、KimiChat、豆包等国内应用,ChatGPT、Claude、Gemini等国外应用。打开