Bootstrap

WSL2+ChatGLM2+FastGPT+oneapi本地化部署

本文记录自己在Win11电脑上部署fastGPT、连接本地大模型ChatGLM2-6b及其相关的工具的详细过程。最近离职在家,想跑通了一套流程后再去找工作,进程有点慢,呜呜。

首先,接上一篇在本地部署大模型chatGLM2-6B并采用各种api和网页demo进行调用,现在已过去好几天。

也是从chatGLM的社区了解到oneapi又间接了解到可以链接知识库得工具fastGPT,这必须要给他弄通啊。

直接先打开官方网址:

Docker Compose 快速部署 | FastGPT (fastai.site)

看一眼架构图:

大概也能看懂,fastGPT后台采用MongoDB和PostgreSQL存储数据,提供前后端应用,在通过oneapi集成各种大模型(包括语言模型和向量模型),再外接知识库进行补充修正,真的很nice。

话不多说,开始部署:

环境:

1、安装WSL2(windows子系统)

如果电脑只用作跑模型,建议直接安装Ubuntu22.04桌面版,或者安装双系统,这样后续操作可能不会遇到那么多坑。

如果想在自己的个人电脑搞大模型,又不影响别的,只能说WSL2真的香。

安装wsl最重要的是微软官方这篇:旧版 WSL 的手动安装步骤 | Microsoft Learn

1.1 启用适用于 Linux 的 Windows 子系统

需要先启用“适用于 Linux 的 Windows 子系统”可选功能,官方命令:

dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart

1.2 检查运行 WSL 2 的要求

需要检查系统是否满足:

我们电脑系统我为Win11,因此可以继续。

1.3 启用虚拟机功能

官方命令:

dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart

PS:可能需要在bios设置中,打开电脑的虚拟化(自行百度,开机按esc\del或者F2、F12这些进入)。

1.1和1.3可以通过启用和关闭windows功能进行设置:

也可打开启用或关闭windows功能:

勾选以下两项:

点击应用。

1.4下载 Linux 内核更新包

Linux 内核更新包会安装最新版本的 WSL 2 Linux 内核,以便在 Windows 操作系统映像中运行 WSL。

1.5将 WSL 2 设置为默认版本

wsl --set-default-version 2

1.6下载Linux发行版,并安装

推荐直接下载.appx文件再采用命令进行安装:

下载链接(网速嗖嗖快~):

命令:

Add-AppxPackage .\app_name.appx

切换到下载目录,并替换安装包名称,即可安装成功。

我这里顺带安装windows终端:

安装完成后的界面:

点击,就直接能够进入Ubuntu的终端了:

也可以通过终端那里的下三角符号进入:

2、安装docker

2.1下载docker desktop

wsl2安装成功了,docker也差不多完事了:

到网址:

Docker Desktop: The #1 Containerization Tool for Developers | Docker

下载windows安装包:

然后双击,下一步,下一步就按照好了。

2.2设置

我们可以打开:

点击设置:

设置镜像下载位置:

启用Ubuntu

好了,ok。

3、通过docker部署fastGPT

看这一步:

我们建立,在windows终端中建立目录,并执行:

curl -O https://raw.githubusercontent.com/labring/FastGPT/main/files/deploy/fastgpt/docker-compose.yml
curl -O https://raw.githubusercontent.com/labring/FastGPT/main/projects/app/data/config.json

可以看到这两个文件:

如果因为网络不能执行成功,官方贴心的放到了文档里,点击下载:

再看下一步:

运行:

# 启动容器
docker-compose up -d
# 等待10s,OneAPI第一次总是要重启几次才能连上Mysql
sleep 10
# 重启一次oneapi(由于OneAPI的默认Key有点问题,不重启的话会提示找不到渠道,临时手动重启一次解决,等待作者修复)
docker restart oneapi

运行完这里,我们可以在docker中看到容器的运行情况:

fastGPT已经在正常运行了。我们登录本地127.0.0.1:3000可以看到登录界面:

这时输入:

账号:root

密码1234,就可以登录fastGPT了。

但是我们需要先把oneapi跑通

4、调试Oneapi

登录网址:http://127.0.0.1:3001/

账户:root 密码:123456

登录后需要修改为8位数。

添加渠道:

设置如下:

重点是模型名称代理那里,模型名称后续需要严格一致,模型名称自定义一个,点击填入即可

代理要设置成本地IP加8000端口,又不能带v1。

本地ip通过ipconfig进行查看。

对于本地chatGLM,密钥那里应该可以空着,没事,要么就填个none。

点击提交。

点击测试:

正确配置是能够测试成功的!

再建立一个令牌:

选择我们建立那个模型:

我们可以通过postman进行测试:

模型名称一定要严格对应:

看看回答:

opeapi在本地是可以联通的了。

令牌这里这个聊天,可以测试对话是否能成功:

这个跟之前在本地部署的NextChat一模一样。

设置一下:

也可以测试成功:

5、调试fastGPT

好了,oneapi也调试通了,可以将大模型连接到fastGPT,尝试接入知识库了吧!

网上找教程:例如这个:

全部本地化!ChatGLM+oneapi+fastgpt+微秘+微信 部署实操_fastgpt 微信-CSDN博客

以及这个搭桥!接通本地大模型+知识库,部署one api搞掂,让知识库拥有大模型能力!17/45 - 知乎 (zhihu.com)

但是主要涉及两个配置:

一是:

二是:

这里面有两个坑。首先这些教程中的fastGPT版本都是4.6.8以前的版本。这在config.json中体现为:

就是前面chatModels那里,需要现在改成这样了.

后边我因为没有跑通,直接进行降级了,但最终的原因不是那个。

降级操作:

调整docker-compose.yml文件中的版本号:

执行:

docker-compose pull
docker-compose up -d

其实也是官方文档:

但这里有需要之前版本config.json文件,需要的进行复制-保存即可:

{
  "systemEnv": {
    "openapiPrefix": "fastgpt",
    "vectorMaxProcess": 15,
    "qaMaxProcess": 15,
    "pgHNSWEfSearch": 100
  },
  "chatModels": [
    {
      "model": "chatGLM2-6b", 
      "name": "chatGLM2-6b", 
      "maxContext": 8000, 
      "maxResponse": 4000, 
      "quoteMaxToken": 2000, 
      "maxTemperature": 1, 
      "vision": false, 
      "defaultSystemChatPrompt": "" 
    },
    {
      "model": "gpt-3.5-turbo",
      "name": "GPT35",
      "inputPrice": 0,
      "outputPrice": 0,
      "maxContext": 4000,
      "maxResponse": 4000,
      "quoteMaxToken": 2000,
      "maxTemperature": 1.2,
      "censor": false,
      "vision": false,
      "defaultSystemChatPrompt": ""
    },
    {
      "model": "gpt-3.5-turbo-16k",
      "name": "GPT35-16k",
      "maxContext": 16000,
      "maxResponse": 16000,
      "inputPrice": 0,
      "outputPrice": 0,
      "quoteMaxToken": 8000,
      "maxTemperature": 1.2,
      "censor": false,
      "vision": false,
      "defaultSystemChatPrompt": ""
    },
    {
      "model": "gpt-4",
      "name": "GPT4-8k",
      "maxContext": 8000,
      "maxResponse": 8000,
      "inputPrice": 0,
      "outputPrice": 0,
      "quoteMaxToken": 4000,
      "maxTemperature": 1.2,
      "censor": false,
      "vision": false,
      "defaultSystemChatPrompt": ""
    },
    {
      "model": "gpt-4-vision-preview",
      "name": "GPT4-Vision",
      "maxContext": 128000,
      "maxResponse": 4000,
      "inputPrice": 0,
      "outputPrice": 0,
      "quoteMaxToken": 100000,
      "maxTemperature": 1.2,
      "censor": false,
      "vision": true,
      "defaultSystemChatPrompt": ""
    }
  ],
  "qaModels": [
    {
      "model": "gpt-3.5-turbo-16k",
      "name": "GPT35-16k",
      "maxContext": 16000,
      "maxResponse": 16000,
      "inputPrice": 0,
      "outputPrice": 0
    }
  ],
  "cqModels": [
    {
      "model": "gpt-3.5-turbo",
      "name": "GPT35",
      "maxContext": 4000,
      "maxResponse": 4000,
      "inputPrice": 0,
      "outputPrice": 0,
      "toolChoice": true,
      "functionPrompt": ""
    },
    {
      "model": "gpt-4",
      "name": "GPT4-8k",
      "maxContext": 8000,
      "maxResponse": 8000,
      "inputPrice": 0,
      "outputPrice": 0,
      "toolChoice": true,
      "functionPrompt": ""
    }
  ],
  "extractModels": [
    {
      "model": "gpt-3.5-turbo-1106",
      "name": "GPT35-1106",
      "maxContext": 16000,
      "maxResponse": 4000,
      "inputPrice": 0,
      "outputPrice": 0,
      "toolChoice": true,
      "functionPrompt": ""
    }
  ],
  "qgModels": [
    {
      "model": "gpt-3.5-turbo-1106",
      "name": "GPT35-1106",
      "maxContext": 1600,
      "maxResponse": 4000,
      "inputPrice": 0,
      "outputPrice": 0
    }
  ],
  "vectorModels": [
    {
      "model": "text-embedding-ada-002",
      "name": "Embedding-2",
      "inputPrice": 0,
      "outputPrice": 0,
      "defaultToken": 700,
      "maxToken": 3000,
      "weight": 100
    }
  ],
  "reRankModels": [],
  "audioSpeechModels": [
    {
      "model": "tts-1",
      "name": "OpenAI TTS1",
      "inputPrice": 0,
      "outputPrice": 0,
      "voices": [
        { "label": "Alloy", "value": "alloy", "bufferId": "openai-Alloy" },
        { "label": "Echo", "value": "echo", "bufferId": "openai-Echo" },
        { "label": "Fable", "value": "fable", "bufferId": "openai-Fable" },
        { "label": "Onyx", "value": "onyx", "bufferId": "openai-Onyx" },
        { "label": "Nova", "value": "nova", "bufferId": "openai-Nova" },
        { "label": "Shimmer", "value": "shimmer", "bufferId": "openai-Shimmer" }
      ]
    }
  ],
  "whisperModel": {
    "model": "whisper-1",
    "name": "Whisper1",
    "inputPrice": 0,
    "outputPrice": 0
  }
}

好了,继续。开始配置:

修改docker-compose.yml:


 

按照教程中的填写本地IP地址就可以访问成功了:

再修改config.json:

然后再执行拉取,更新操作:

docker-compose pull
docker-compose up -d

应该就能完美运行了!

但是我试试:

docker命令执行成功。

登录fastGPT,建立应用,并聊天对话:

嗯?卡半天,然后不成功!

6、解决stack: 'Error: Connection error.\n'报错,成功连接本地大模型

在dockerdesktop中查看fastGPT日志:

就报连接超时!

我仔细对比,没有什么不同啊啊,看社区别人提bug,都说是网络问题,但是问题出在哪里呢?我们本地调用3001端口没有问题,ping192.168.1.3也没问题。

设置防火墙、降低fastGPT版本这些都试了,但还是不行!

卡了好久!

最后、最后、最后!

还是百度好使啊!

看这个博客:

Fastgpt+oneapi均使用docker部署报错Connection error_fastgpt connection error.-CSDN博客

原来 docker-compose.yml文件配置的这地址是个巨坑!!!!

我们采用docker部署的地址不是本地IP,而是:

而是docker里面这个虚拟的IP地址:

替换:

再执行:

docker-compose pull
docker-compose up -d

啊啊啊啊,哇哦,终于搞通了!

下一步,可以尝试再部署向量模型,或者接入知识库了!

;