Bootstrap

快速上手:LLaMA-Factory教你如何训练专属于你的LLM大模型

为什么要进行模型微调?

这里可以举一个简单的例子:

假设小明刚从新东方毕业,他每样菜都会做一点,但是每样菜都做的一般般

然后他进入了一家川菜馆,每天都做麻婆豆腐,边做还边练习,最后成了一个做麻婆豆腐的高手。

这里刚毕业的小明就是预训练的模型,边做边练习麻婆豆腐就是微调的过程!

所以,为了让预训练的模型具备更多的知识或者增强模型在某方面的能力来满足我们的需求,我们需要对模型进行微调。

LLaMA-Factory

LLaMA-Factory 是一个国内北航开源的低代码大模型训练框架,专为大型语言模型(LLMs)的微调而设计。不仅高效低成本,而且有UI界面,非常方便使用。今天我们就来介绍一下怎么使用LLaMA-Factory对预训练模型进行微调。

开源地址:https://github.com/hiyouga/LLaMA-Factory

使用LLaMA-Factory微调llama-3-8b-Instruct-bnb-4bit

这里我们演示的是在Colab上开源的代码,Colab上有免费的GPU资源,足够我们学习使用,在本地微调的话就需要把所有代码在本地运行。

01.打开Colab地址

https://colab.research.google.com/drive/1d5KQtbemerlSDSxZIfAaWXhKr30QypiK?usp=sharing

登录后点击“连接T4”,Colab上有免费的T4可以使用

免费 T4 申请教程:https://zhuanlan.zhihu.com/p/642542618

02.安装LLaMA Factory依赖

03.检查GPU环境

04.更新Identity Dataset

可以自由修改 NAME 和 AUTHOR 变量的内容。

05.打开微调UI界面

运行成功后会生成一个网址,打开就是微调界面

使用UI界面微调大模型视频教程:

微调LLaMA大模型数据

博主会不定期的分享各种有关深度学习、机器学习、AI大模型等AI方面的内容。

欢迎大家关注。

;