Bootstrap

书单 | 大模型的书那么多,如何快速选到适合自己的那一本?来,教你!

大模型的书这么多,该怎么选呢?

本期书单就来教大家怎么快速地从众多大模型书中选到你想要的那一本!

大模型基础

大模型入门不可错过的一本书,就是这本大模型界的经典畅销书**《大规模语言模型》**!系统性强,内容适合初学者,如果你想知道如何构建一个大模型应用,系统了解大模型的构建,选它准没错!

**▊《**大规模语言模型:从理论到实践》

张奇,桂韬,郑锐,黄萱菁 著

  • 解码大语言模型奥秘,引领机器智能新时代

  • 详细介绍构建LLM的四个主要阶段:预训练、有监督微调、奖励建模和强化学习

  • 解读ChatGPT背后的核心技术

  • 配全书PPT课件

为了使更多的自然语言处理研究人员和对大语言模型感兴趣的读者能够快速了解大模型的理论基础,并开展大模型实践,复旦大学张奇教授团队结合他们在自然语言处理领域的研究经验,以及分布式系统和并行计算的教学经验,在大模型实践和理论研究的过程中,历时8个月完成本书的撰写。希望这本书能够帮助读者快速入门大模型的研究和应用,并解决相关技术问题。

本书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。

本书以大语言模型的基础理论开篇,探讨了大语言模型预训练数据的构建方法,以及大语言模型如何理解并服从人类指令,介绍了大语言模型的应用和评估方法,为读者提供了更全面的视野。

本书旨在为对大语言模型感兴趣的读者提供入门指南,也可作为高年级本科生和研究生自然语言处理相关课程的补充教材!

《大语言模型》,作者来自一线的产业界,书中有工程实践,代码配套齐全,如果你想了解更多产业实践方面的内容,就选它!

**▊《**大语言模型:原理与工程实践》

杨青 编著

  • 揭开LLM的神秘面纱,解读其机理和工程实践,手把手教你训练7B LLM

本书用10 章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论,帮助读者深入了解大语言模型的构建和训练过程。然后,详细介绍有监督微调和强化对齐等技术,以及如何评估大语言模型的性能。外,介绍提示工程和工程实践等方面的内容,帮助读者了解大语言模型的应用和实际操作过程。最后,介绍如何从零开始微调大语言模型,辅以代码示例,帮助读者更好地应用这些技术。

通过阅读本书,读者可以获得全面且深入的大语言模型的知识框架。无论您是研究人员、工程师,还是产品经理,都能从中获得有价值的知识。

《解构大语言模型》,从模型发展史的角度,带你在技术层面上了解大模型是如何从最简单的线性回归模型发展为如今的大语言模型的,精细解读了模型架构与代码实现,有助于打好基本功,对大模型有更深的理解和认识!

**《解构大语言模型:从线性回归到通用人工智能(全彩)》**

唐亘 著

  • 从模型结构和数据基础两大角度解构大语言模型

  • 详解经典模型的核心结构及实现过程,夯实基础

  • 模型开发与调优,重构ChatGPT,GitHub配套代码

  • 融合统计分析/机器学习/经济学等知识,全彩印刷

本书从模型的结构和数据基础两个方面解构大语言模型,以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面,大语言模型属于深度神经网络,其设计核心是注意力机制,因此,本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面,本书既涉及模型训练的工程基础,如反向传播,又涉及数据的使用方式,如迁移学习、强化学习,以及传统的监督学习和无监督学习。此外,本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感,以提高模型的稳定性和可解释性。

本书既适用于希望深入了解大语言模型、通过人工智能技术解决实际问题的读者,也适合作为高等院校计算机及相关专业的师生参考用书。

《大语言模型应用指南》,这本书更侧重于对大模型的使用,从如何使用ChatGPT到如何基于大模型进行二次开发、创建GPTs、Agent系统分析等,由浅入深,带你了解大模型应用的一切!小白读者也可以读懂~~

**▊《**大语言模型应用指南:以ChatGPT为起点,从入门到精通的AI实践教程(全彩)》

万俊 著

  • 大语言模型的应用与二次开发

  • 探索智能前沿,驾驭模型力量,对人工智能或编程技术小白读者友好

  • 技术点包含提示工程、长短期记忆、GPTs、Agent系统、微调与安全技术、GPT-4V与Gemini、尺度定律与压缩即智能等

本书是一本对人工智能小白读者非常友好的大语言模型应用指南,有两大特点:一是以通俗易懂的方式解释复杂概念,通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法,包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆,以及外部工具等,使读者能够全面了解和掌握这一先进技术的应用和二次开发;二是紧跟当前大语言模型技术的更新动态,介绍GPTs的创建,以GPT-4V和Gemini为例讲述多模态模型的应用,还包括无梯度优化、自主Agent系统、大语言模型微调、RAG框架微调、大语言模型安全技术等。

无论是学术研究者、工程师,还是对大语言模型感兴趣的普通读者,都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例,从而更好地应用大语言模型解决实际问题。

多模态大模型

了解了以上大模型的基础内容,再来看看如今已经实现了文本-图像-语音-视频“大统一”的多模态大模型!

两本《多模态大模型》,该怎么选呢?

想要系统全面地了解多模态大模型的技术理论知识及应用,就选这本**《多模态大模型:新一代人工智能技术范式》**。

;