kiln微调大模型-使用deepseek R1去训练一个你的具备推理能力的chatGPT 4o

前言

随着deepseek的爆火，对于LLM的各种内容也逐渐步入我的视野，我个人认为，可能未来很长一段时间，AI将持续爆火，进入一段时间的井喷期，AI也会慢慢的走入我们每个家庭之中，为我们的生活提供便利，由此出发，我将在接下的内容里面给大家讲一下如何使用kiln.ai去微调你自己的大模型

本文使用的为最简单的kiln AI，Kiln AI 是一款开源的 AI 开发工具，能够简化大型语言模型大型语言模型（LLM）的微调、合成数据生成和数据集协作。它提供直观的桌面应用程序，支持 Windows、MacOS 和 Linux，用户可以基于零代码方式对多种模型进行微调并自动部署。

如果你看完本文觉得很简单，可以去尝试进阶版的unsloth和其他的微调工具，功能会更加强大，具备更多功能

（下图来自b站up九析，大家可以去up那学习一下，我讲的可能还有很多不到位的）

下载连接：Kiln 的 GitHub 发布页面：大型语言模型

（因为是github链接，需要翻墙）

下图为Windows安装包

下载解压好后双击运行就行

安装运行之后会在网页打开一个标签页

这样就安装好了

接下来我们需要用到ollama蒸馏的deepseek R1 14b模型（因为低于14b在继续数据集训练时会出错）和open ai的key

【我后面会专门出一个安装ollama，并在本地上跑的教程，暂时不会的小伙伴可以先了解流程后续实践一下】

点击GET STARTED我们开始kiln AI微调的大门

在这里连接本地的ollama和openAI的key

创建你的项目名，也可以直接用案例

接着编写你这个项目的要求和任务（可以理解为你想这个智能体成为什么样的人），我这也是直接使用的案例（创建一个笑话生成器）

run这里写入你的主题，然后选择你的模型，他会根据你的要求生成一个回答

生成的数据会在dataset里面显示

在这里使用openAI去生成你要生成的主题和他对应的子主题，然后生成你需要的数据，当所有数据生成完毕时点击save all

在弹出的面板里点击你需要的微调的模型，比如我们这边就是deepseek R1（因为我们需要把open AI的训练出自主思考的能力）

然后点击run and save去用deepseek R1讲数据集进行整合（需要等待一段时间）