Bootstrap

【大模型】基于LLaMA-Factory的模型高效微调

LLaMA-Factory项目介绍

在这里插入图片描述
LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调,框架特性包括:

  • 模型种类:LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。

  • 训练算法:(增量)预训练、(多模态)指令监督微调、奖励模型训练、PPO 训练、DPO 训练、KTO 训练、ORPO 训练等等。

  • 运算精度:16 比特全参数微调、冻结微调、LoRA 微调和基于 AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ 的 2/3/4/5/6/8 比特 QLoRA 微调。

  • 优化算法:GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ 和 PiSSA。

  • 加速算子:FlashAttention-2 和 Unsloth。

  • 推理引擎:Transformers 和 vLLM。

  • 实验面板:LlamaBoard、TensorBoard、Wandb、MLflow 等等。

  • LLaMA-Factory项目地址:https://github.com/hiyouga/LLaMA-Factory

  • LLaMA-Factory官方文档:https://llamafactory.readthedocs.io/zh-cn/latest/index.html

🤗 强烈推荐LLaMA-Factory官方文档,写得十分详细易懂!手动点赞 o( ̄▽ ̄)o 🤗

LLaMA-Factory 安装

参考官方安装说明文档:https://llamafactory.readthedocs.io/zh-cn/latest/getting_started/installation.html

在安装 LLaMA-Factory 之前,请确保您安装了下列依赖:

运行以下指令以安装 LLaMA-Factory 及其依赖:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

如果出现环境冲突,请尝试使用 pip install --no-deps -e . 解决

LLaMA-Factory 的使用

[待更新…]

参考资料

Llama3本地部署与高效微调入门

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;