基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[5]-高阶实战微调 - 悦读

基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[5]-高阶实战微调

基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[5]-高阶实战微调

在这里插入图片描述

1.推荐的模型组合

在默认的配置文件中，我们提供了以下模型组合

LLM: Chatglm2-6b
Embedding Models: m3e-base
TextSplitter: ChineseRecursiveTextSplitter
Kb_dataset: faiss

我们推荐开发者根据自己的业务需求进行模型微调，如果不需要微调且配置充足，可选择以下性能较好的配置

model_config.py
LLM: Qwen-14B-Chat 或 Baichuan2-13B-Chat
Embedding Models: piccolo-large-zh 或 bge-large-zh-v1.5 
HISTORY_LEN = 20
TEMPERATURE = 0.1

使用该模型将需要更高的硬件要求

1张 RTX A6000 或者 A40 等 48GB 显存以上的显卡。推荐 1 x A100 以上。
(使用多张显卡拼接也能运行&#x

悦读

道可道，非常道；名可名，非常名。无名，天地之始，有名，万物之母。故常无欲，以观其妙，常有欲，以观其徼。此两者，同出而异名，同谓之玄，玄之又玄，众妙之门。

Android Fragment 学习备忘

四大运营商频段划分及2~5G主力频段的划分

前端vue中文件下载的几种方式

基于JAVA+SpringBoot+Mybatis+MYSQL的慢性病报销管理系统

java mysql地址中的 useUnicode=true&characterEncoding=utf-8

从零Makefile落地算法大项目

(雷达数据处理中的)跟踪算法(3) – 可用于目标跟踪实践的数据集介绍&解析

【CSDN软件工程师能力认证学习精选】Web前端经典面试试题及答案-史上最全前端面试题(含答案)

linux网络socket

解决低版本pytorch和onnx组合时torch.atan2()不被onnx支持的问题

;