在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬),并将持续更新…
Expand Table of Contents
- NLU系列
- NLG系列
- NLU-NLG系列
- Multi-Modal
- Table
Base-LLM
大规模基础模型:表格中只罗列出参数量
大于7B
以上模型。
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 架构 | 文献 | 备注 |
---|---|---|---|---|---|---|---|---|---|---|
Breeze-Base | 7B | 2024-02 | 中英 | 通用 | 🤗HF | / | MediaTek Research | |||
TowerBase | 7/13B | 2024-02 | 多语 | 通用 | [🤗HF] | / | Unbabel | CD | ||
Qwen1.5-Base | 0.5/1.8/4 7/14/72B | 2024-02 | 中英 | 通用 | [🤗HF] | Qwen1.5 | Qwen | / | Blog | |
LongAlign-Base | 6/7/13B | 2024-02 | 中英 | 通用 | [🤗HF] | LongAlign | THUDM | / | Paper | |
Chinese-Mixtral-Base | 8x7B | 2024-02 | 中英 | 通用 | [Baidu] [🤗HF] | Chinese-Mixtral | Yiming Cui | MOE | ||
iFlytekSpark-Base | 13B | 2024-01 | 中英 | 通用 | mindspore | / | 科大讯飞 | CD | ||
Orion-Base | 14B | 2024-01 | 多语 | 通用 | [🤗HF] | Orion | OrionStarAI | CD | Paper | RAG Plugin |
YaYi2-Base | 30B | 2023-12 | 多语 | 通用 | [🤗HF] | YAYI2 | wenge-research | CD | Paper | |
Aquila2-Base | 7/34/70B | 2023-12 | 中英 | 通用 | [🤗HF] | Aquila2 | FlagAI | CD | ||
Alaya-Base | 7B | 2023-12 | 中英 | 通用 | [🤗HF] | Alaya | DataCanvas | CD | ||
Qwen-Base | 1.8/7 14/72B | 2023-12 | 中英 | 通用 | [🤗HF] | Qwen | 阿里云 | CD | Paper Report Report2 | |
DeepSeek-Base | 7/67B | 2023-11 | 中英 | 通用 | [🤗HF] | DeepSeek-LLM | deepseek-ai | CD | ||
Yuan-2.0 | 2/51 102B | 2023-11 | 中英 | 通用 | baidu [🤗HF] | Yuan-2.0 | IEIT-Yuan | CD | ||
Alaya-Base | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | Alaya | DataCanvasIO | CD | ||
Yi-Base | 6/9/34B | 2023-11 | 中英 | 通用 | [🤗HF] | Yi | 01.AI | CD | ||
XVERSE-Base | 7/13 65B | 2023-11 | 多语 | 通用 | [🤗HF] | XVERSE | 元象科技 | CD | ||
Nanbeige-Base | 16B | 2023-11 | 中英 | 通用 | [🤗HF] | Nanbeige | Nanbeige LLM Lab | CD | ||
LingoWhale | 8B | 2023-11 | 中英 | 通用 | [🤗HF] | LingoWhale-8B | DeepLang AI | CD | ||
Skywork-base | 13B | 2023-10 | 中文 | 通用 | [🤗HF] | Skywork | SkyworkAI | CD | Paper | |
BlueLM-Base | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | BlueLM | vivo AI Lab | CD | ||
Chatglm3-base | 6B | 2023-10 | 中英 | 通用 | [🤗HF] | ChatGLM3 | THUDM | ND | ||
Ziya2-Base | 13B | 2023-10 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | ||
OpenBA-LM | 15B | 2023-09 | 中英 | 通用 | [🤗HF] | OpenBA | OpenNLG Group | ED | Paper | |
TigerBot-Base-70B | 80B | 2023-09 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | Paper | |
FLM | 101B | 2023-09 | 中英 | 通用 | [🤗HF] | / | CofeAI | CD | ||
falcon | 7/40 180B | 2023-09 | 多语 | 通用 | [🤗HF] | / | Technology Innovation Institute | CD | ||
Baichuan2 | 7/13B | 2023-09 | 中文 | 通用 | [🤗HF] | Baichuan2 | 百川智能 | CD | ||
Chinese-LLaMA-2-16K | 7/13B | 2023-08 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
YuLan-LLaMA-2 | 13B | 2023-08 | 中英 | 通用 | [🤗HF] | YuLan-Chat | 中国人民大学 | CD | ||
Aquila-Base-33B | 33B | 2023-08 | 中英 | 通用 | TODO | Aquila | FlagAI | CD | ||
TigerBot-Base-13B | 13B | 2023-08 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | ||
Linly-Chinese-LLaMA-2 | 7/13B | 2023-07 | 中英 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | ||
Chinese-LLaMA-2 | 7B | 2023-07 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
Jiang-base | 13B | 2023-07 | 中文 | 通用 | [🤗HF] | / | 知未智能 | CD | ||
bwx | 7/13B | 2023-07 | 中文 | 通用 | [🤗HF] | / | 蓝鲸国数 | CD | ||
Llama2 | 7/13 70B | 2023-07 | 多语 | 通用 | [🤗HF] | llama | Meta | CD | Paper | |
PolyLM | 13B | 2023-07 | 多语 | 通用 | [🤗HF] | PolyLM | 达摩院 | CD | Paper | |
Baichuan-13B | 13B | 2023-07 | 中文 | 通用 | [🤗HF] | Baichuan-13B | 百川智能 | CD | ||
TigerBot | 7B | 2023-07 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | ||
InternLM-base | 7/20B | 2023-07 | 中文 | 通用 | [🤗HF] | InternLM | 上海人工智能实验室 | CD | report | |
MPT | 7/30B | 2023-06 | 多语 | 通用 | [🤗HF] | llm-foundry | MosaicML | CD | ||
Baichuan | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | baichuan-7B | 百川智能 | CD | ||
Chinese-Falcon | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | Blog | |
AtomGPT | 13B | 2023-06 | 中英 | 通用 | [🤗HF] | / | 原子回声 | CD | ||
Aquila | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | Aquila | FlagAI | CD | ||
Chinese-LLaMA | 33B | 2023-06 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | ||
TigerBot | 7B | 2023-06 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | ||
Panda-OpenLLaMA | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | pandallm | dandelionsllm | CD | ||
Panda | 7/13B | 2023-05 | 中英 | 通用 | [🤗HF] | pandallm | dandelionsllm | CD | ||
OpenLLaMA | 13B | 2023-05 | 中英 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | ||
BiLLa-LLM | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | BiLLa | Zhongli Li | CD | ||
Ziya-LLaMA-Reward | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | ||
YuYan | 11B | 2023-04 | 中文 | 通用 | [🤗HF] | / | 网易伏羲 | CD | Paper | |
Chinese-LLaMA | 7/13/33B | 2023-04 | 中文 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | Blog | |
OpenChineseLLaMA | 7B | 2023-04 | 中英 | 通用 | [🤗HF] | OpenChineseLLaMA | OpenLMLab | CD | ||
MOSS-003 | 16B | 2023-04 | 中英 | 通用 | [🤗HF] | MOSS | 复旦大学 | CD | ||
BBT-2-Text | 13B | 2023-04 | 中文 | 通用 | 申请 | BBT-FinCUGE-Applications | 超对称 | CD | Paper | |
BBT-2-Text | 12B | 2023-04 | 中文 | 通用 | 申请 | BBT-FinCUGE-Applications | 超对称 | CD | Paper | |
Chinese-LLaMA | 13B | 2023-04 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | ||
flan-ul2 | 20B | 2023-03 | 多语 | 通用 | [🤗HF] | ul2 | ED | Paper | ||
CPM-Bee | 10B | 2023-01 | 中英 | 通用 | [🤗HF] | CPM-Bee | OpenBMB | CD | ||
BLOOM | 176B | 2022-11 | 多语 | 通用 | [🤗HF] | Megatron-DeepSpeed | BigScience | CD | Paper | |
BLOOMZ | 176B | 2022-11 | 多语 | 通用 | [🤗HF] | Megatron-DeepSpeed | BigScience | CD | Paper | |
flan-t5-xxl | 11B | 2022-11 | 多语 | 通用 | [🤗HF] | t5x | ED | paper | ||
CPM-Ant+ | 10B | 2022-10 | 中英 | 通用 | BMB | CPM-Live | OpenBMB | CD | blog | |
GLM | 130B | 2022-10 | 中英 | 通用 | 申请 | GLM-130B | 清华大学 | ND | paper | |
CPM-Ant | 10B | 2022-09 | 中文 | 通用 | [🤗HF] | CPM-Live | OpenBMB | CD | blog | |
GLM | 10B | 2022-09 | 中文 | 通用 | [🤗HF] | GLM | 清华大学 | ND | paper | |
源1.0 | 245B | 2021-09 | 中文 | 通用 | API | Yian-1.0 | 浪潮 | CD | paper | |
CPM-2 | 10/11/ 200B | 2021-06 | 中文 | 通用 | 申请 | CPM | 智源研究院 | ED | paper | |
PanGu-Alpha | 13/200B | 2021-05 | 中文 | 通用 | [🤗HF] | PanGu-Alpha | 鹏城实验室 | CD | paper | |
PLUG | 27B | 2021-04 | 中文 | 通用 | 申请 | AliceMind | 阿里巴巴 | ED | ||
GPT-3 | 13/30B | 2021-04 | 中文 | 通用 | TODO | GPT-3 | 达摩院 | CD |
Domain-Base-LLM
各个垂直领域开源基础模型
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 架构 | 文献 | 备注 |
---|---|---|---|---|---|---|---|---|---|---|
Tongyi-Finance-Base | 14B | 2023-11 | 中文 | 金融 | ModelScope | 通义金融-14B | 通义金融大模型 | CD | ||
ChiMed-GPT | 13B | 2023-10 | 中文 | 医疗 | [🤗HF] | ChiMed-GPT | 中国科学技术大学 | CD | Paper | |
CodeShell-base | 7B | 2023-10 | 中英 | 代码 | [🤗HF] | codeshell | WisdomShell | CD | ||
WiNGPT-base | 7B | 2023-09 | 中文 | 医学 | [🤗HF] | WiNGPT2 | Winning Health AI Research | CD | ||
XuanYuan | 70B | 2023-09 | 中文 | 金融 | [🤗HF] | XuanYuan | 度小满 | CD | Report | |
CodeLLAma | 7/13/ 34B | 2023-08 | 多语 | 代码 | [🤗HF] | codellama | Meta Research | CD | Paper | |
educhat-base-002 | 7/13B | 2023-06 | 中英 | 教育 | [🤗HF] | EduChat | 华东师范大学 | CD | ||
AquilaCode-NV | 7B | 2023-06 | 中英 | 代码 | [🤗HF] | Aquila | FlagAI | CD | ||
AquilaCode-TS | 7B | 2023-06 | 中英 | 代码 | [🤗HF] | Aquila | FlagAI | CD | ||
LaWGPT | 7B | 2023-05 | 中英 | 法律 | [🤗HF] | LawGPT | Pengxiao Song | CD | ||
CodeGeeX | 13B | 2022-06 | 多语 | 代码 | 申请 | CodeGeeX | 清华大学 | CD | blog |
ChatLLM
具备问答和对话等功能的大型语言模型。
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 架构 | 文献 |
---|---|---|---|---|---|---|---|---|---|
Command-R | 35B | 2024-03 | 多语 | 通用 | 🤗HF | / | CohereForAI | CD | |
Breeze-Instruct | 7B | 2024-02 | 中英 | 通用 | 🤗HF | / | MediaTek Research | ||
aya-101 | 13B | 2024-02 | 多语 | 通用 | 🤗HF | / | Cohere For AI | CD | Paper |
ChemLLM | 7B | 2024-02 | 多语 | 通用 | 🤗HF | / | AI4Chem | CD | Paper |
TowerInstruct | 7/13B | 2024-02 | 多语 | 通用 | [🤗HF] | / | Unbabel | CD | |
Qwen1.5-Chat | 0.5/1.8/4/ 7/1472B | 2024-02 | 中英 | 通用 | [🤗HF] | Qwen1.5 | Qwen | / | Blog |
MiniCPM | 2B | 2024-02 | 中英 | 通用 | [🤗HF] ModelScope | MiniCPM | OpenBMB | / | Report |
LongAlign-Chat | 6/7/13B | 2024-02 | 中英 | 通用 | [🤗HF] | LongAlign | THUDM | / | Paper |
Chinese-Mixtral-Chat | 8x7B | 2024-02 | 中英 | 通用 | [Baidu] [🤗HF] | Chinese-Mixtral | Yiming Cui | MOE | |
iFlytekSpark-Chat | 13B | 2024-01 | 中英 | 通用 | mindspore | / | 科大讯飞 | CD | |
rwkv-5-world | 0.1/1/ 3/7B | 2023-01 | 多语 | 通用 | [🤗HF] | RWKV-LM | BlinkDL | URL | |
Orion-Chat | 14B | 2024-01 | 多语 | 通用 | [🤗HF] | Orion | OrionStarAI | CD | Paper |
internlm2-chat | 7/20B | 2024-01 | 中英 | 通用 | [🤗HF] | InternLM | InternLM | CD | Report |
Chinese-Mixtral | 8x7B | 2023-01 | 中英 | 通用 | [🤗HF] | / | HIT-SCIR | CD-MOE | |
Telechat | 7/12B | 2024-01 | 中英 | 通用 | [🤗HF] | Telechatx | Tele-AI | CD | Report |
kagentlms | 7/13B | 2024-01 | 中英 | 通用 | [🤗HF] | KwaiAgents | KwaiKEG | ||
YaYi2-Chat | 30B | 2023-12 | 多语 | 通用 | [🤗HF] | YAYI2 | wenge-research | CD | Paper |
SUS-Chat | 34/72B | 2023-12 | 中英 | 通用 | [🤗HF] | SUS-Chat | SUSTech-IDEA | CD | |
Aquila2-Chat | 7/34/70B | 2023-12 | 中英 | 通用 | [🤗HF] | Aquila2 | FlagAI | CD | |
Alaya-Chat | 7B | 2023-12 | 中英 | 通用 | [🤗HF] | Alaya | DataCanvas | CD | |
Qwen-Chat | 1.8/7/ 14/72B | 2023-12 | 中英 | 通用 | [🤗HF] | Qwen | 阿里云 | CD | Paper Report Report2 |
DeepSeek-Chat | 7/67B | 2023-11 | 中英 | 通用 | [🤗HF] | DeepSeek-LLM | deepseek-ai | CD | |
Yi-Chat | 6/34B | 2023-11 | 中英 | 通用 | [🤗HF] | Yi | 01.AI | CD | |
Alaya-Chat | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | Alaya | DataCanvasIO | CD | |
OrionStar-Yi-Chat | 34B | 2023-11 | 中英 | 通用 | [🤗HF] | OrionStar-Yi-34B-Chat | OrionStarAI | CD | |
Nanbeige-Chat | 16B | 2023-11 | 中英 | 通用 | [🤗HF] | Nanbeige | Nanbeige LLM Lab | CD | |
OpenChat 3.5 | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | openchat | OpenChat | CD | Paper |
XVERSE-Chat | 7/13B | 2023-11 | 多语 | 通用 | [🤗HF] | XVERSE | 元象科技 | CD | |
AndesGPT | 7B | 2023-11 | 中文 | 通用 | [🤗HF] | AndesGPT-7B | OPPO-Mente-Lab | CD | |
SeaLLM-Chat | 13B | 2023-11 | 多语 | 通用 | [🤗HF] | SeaLLMs | SeaLLMs | CD | |
BlueLM | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | BlueLM | vivo AI Lab | CD | |
Skywork-chat | 13B | 2023-10 | 中文 | 通用 | [🤗HF] | Skywork | SkyworkAI | CD | Paper |
Zephyr | 7B | 2023-10 | 多语 | 通用 | [🤗HF] | alignment-handbook | Hugging Face H4 | CD | Paper |
Mistral | 7B | 2023-10 | 多语 | 通用 | [🤗HF] | mistral-src | Mistral AI | CD | Paper |
chatglm3 | 6B | 2023-10 | 中英 | 通用 | [🤗HF] | ChatGLM3 | THUDM | ND | |
Zhiyin-chat | 7B | 2023-10 | 中英 | 通用 | [🤗HF] | Zhiyin | 中科院声学所 | CD | |
Ziya2-Chat | 13B | 2023-10 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | |
Vulture | 40/180B | 2023-10 | 多语 | 通用 | [🤗HF] | / | VILM-AI | TODO | |
Vulture | 3/7/ 40/180B | 2023-09 | 多语 | 通用 | [🤗HF] | / | VILM | CD | |
Colossal-LLaMA-2 | 7B | 2023-09 | 中英 | 通用 | [🤗HF] | ColossalAI | HPC-AI Tech | CD | Blog |
OpenBA-chat | 15B | 2023-09 | 中英 | 通用 | TODO | OpenBA | OpenNLG Group | ED | Paper |
WeMix-LLaMA2 | 7/70B | 2023-09 | 中英 | 通用 | [🤗HF] | WeMix-LLM | Alpha-VLLM | CD | |
Stable Beluga | 7/13/70B | 2023-09 | 中英 | 通用 | [🤗HF] | / | Stability AI | CD | |
TigerBot-chat | 70B | 2023-09 | 中英 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | Paper |
Openbuddy_llama | 70B | 2023-09 | 多语 | 通用 | [🤗HF] | OpenBuddy | OpenBuddy | CD | |
falcon-180B-chat | 180B | 2023-09 | 多语 | 通用 | [🤗HF] | / | Technology Innovation Institute | CD | |
Baichuan2 | 7/13B | 2023-09 | 中文 | 通用 | [🤗HF] | Baichuan2 | 百川智能 | CD | |
Chinese-Alpaca-2-16K | 7/13B | 2023-09 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | |
InternLM-Chat-8k | 7B | 2023-08 | 中文 | 通用 | [🤗HF] | InternLM | 上海人工智能实验室 | CD | report |
InternLM-Chat-v1.1 | 7B | 2023-08 | 中文 | 通用 | [🤗HF] | InternLM | 上海人工智能实验室 | CD | report |
YuLan-Chat-2 | 13B | 2023-08 | 中英 | 通用 | [🤗HF] | YuLan-Chat | 中国人民大学 | CD | |
falcon | 7/40B | 2023-06 | 多语 | 通用 | [🤗HF] | [🤗HF] | Technology Innovation Institute | CD | |
Toucan | 7B | 2023-08 | 中英 | 通用 | [🤗HF] | Toucan-LLM | Kendryte | CD | |
Zhuzhi | 6B | 2023-08 | 中英 | 通用 | [🤗HF] | Zhuzhi-6B | 竹间智能 | ND | |
Atom | 7B | 2023-08 | 中英 | 通用 | [🤗HF] | Llama2-Chinese | FlagAlpha | CD | |
openbuddy | 3/7/ 13/40B | 2023-08 | 多语 | 通用 | [🤗HF] | OpenBuddy | OpenBuddy | CD | |
Aquila-Chat-33B | 33B | 2023-08 | 中英 | 通用 | TODO | Aquila | FlagAI | CD | |
vicuna-V1.5-16K | 7/13B | 2023-08 | 多语 | 通用 | [🤗HF] | FastChat | lm-sys | CD | Paper |
vicuna-V1.5 | 7/13B | 2023-08 | 多语 | 通用 | [🤗HF] | FastChat | lm-sys | CD | Paper |
Chinese-Alpaca-2 | 13B | 2023-08 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | |
WizardLM-V1.0 | 70B | 2023-08 | 多语 | 通用 | [🤗HF] | WizardLM | operatorx | CD | |
TigerBot-chat-13B | 13B | 2023-07 | 中英 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | |
huozi | 7B | 2023-08 | 中英 | 通用 | [🤗HF] | huozi | 哈工大 | CD | |
Chinese-Alpaca-2 | 7B | 2023-07 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | |
AntX | 7/13B | 2023-07 | 中文 | 通用 | [🤗HF] | / | AntX.ai | CD | |
BatGPT | 15B | 2023-07 | 中英 | 通用 | [🤗HF] | BatGPT | 上海交通大学 | ND | Paper |
WizardLM-V1.2 | 13B | 2023-07 | 多语 | 通用 | [🤗HF] | WizardLM | operatorx | CD | Paper |
llama2-Chinese-chat | 13B | 2023-07 | 中英 | 通用 | [🤗HF] | llama2-Chinese-chat | Ke Bai | CD | |
Jiang-chat | 13B | 2023-07 | 中文 | 通用 | [🤗HF] | / | 知未智能 | CD | |
Llama2-chinese-chat | 7/13B | 2023-07 | 中英 | 通用 | [🤗HF] | Llama2-Chinese | FlagAlpha | CD | |
LL7M | 7B | 2023-07 | 多语 | 通用 | [🤗HF] | / | Joseph Cheung | CD | |
Chinese-Llama-2 | 7B | 2023-07 | 中英 | 通用 | [🤗HF] | Chinese-Llama-2-7b | LinkSoul-AI | CD | |
Llama2-chat | 7/13/70B | 2023-07 | 多语 | 通用 | [🤗HF] | llama | Meta | CD | Paper |
PolyLM-chat | 13B | 2023-07 | 多语 | 通用 | [🤗HF] | PolyLM | 达摩院 | CD | Paper |
Baichuan-13B-chat | 13B | 2023-07 | 中文 | 通用 | [🤗HF] | Baichuan-13B | 百川智能 | CD | |
vicuna-V1.3 | 7/13/33B | 2023-07 | 多语 | 通用 | [🤗HF] | FastChat | lm-sys | CD | Paper |
WizardLM-V1.0 | 7/13/30B | 2023-07 | 多语 | 通用 | [🤗HF] | WizardLM | operatorx | CD | Paper |
TigerBot-v2-sft | 7B | 2023-07 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | |
InternLM-chat | 7/20B | 2023-07 | 中文 | 通用 | [🤗HF] | InternLM | 上海人工智能实验室 | CD | report |
vicuna汉化版 | 33B | 2023-07 | 中文 | 通用 | baidu-hiks | chinese-StableVicuna | ziwang-com | CD | |
CuteGPT | 13B | 2023-07 | 中英 | 通用 | [🤗HF] | CuteGPT | 复旦大学知识工场 | CD | |
MPT-chat | 7/30B | 2023-06 | 多语 | 通用 | [🤗HF] | llm-foundry | MosaicML | CD | |
ChatGLM2 | 6B | 2023-06 | 中英 | 通用 | [🤗HF] | ChatGLM2-6B | 清华大学 | ND | |
BayLing | 7/13B | 2023-06 | 中英 | 通用 | [🤗HF] | BayLing | 中国科学院 | CD | |
ZhiXi-Diff | 13B | 2023-06 | 中英 | 通用 | [🤗HF] | KnowLLM | 浙江大学 | CD | |
Anima | 33B | 2023-06 | 中文 | 通用 | [🤗HF] | Anima | Gavin Li | CD | |
OpenLLaMA-Chinese | 3/7/13B | 2023-06 | 中文 | 通用 | [🤗HF] | OpenLLaMA-Chinese | FittenTech | CD | |
openbuddy-falcon-7b-v1.5 | 7B | 2023-06 | 多语 | 通用 | [🤗HF] | OpenBuddy | OpenBuddy | CD | |
AtomGPT_chat | 13B | 2023-06 | 中英 | 通用 | [🤗HF] | AtomGPT | 原子回声 | CD | |
AquilaChat | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | Aquila | FlagAI | CD | |
YuLan-Chat | 13/65B | 2023-06 | 中英 | 通用 | [🤗HF] | YuLan-Chat | 中国人民大学 | CD | |
Chinese-Alpaca | 33B | 2023-06 | 中文 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | |
TigerBot-sft | 7/180B | 2023-06 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | |
ChatYuan | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | ChatYuan-7B | ClueAI | CD | |
Panda-Instruct | 13B | 2023-05 | 中英 | 通用 | [🤗HF] | pandallm | dandelionsllm | CD | |
Panda-Instruct | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | pandallm | dandelionsllm | CD | |
BiLLa-SFT | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | BiLLa | Zhongli Li | CD | |
Ziya-LLaMA-v1 | 13B | 2023-05 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | Blog |
BLOOMChat V1.0 | 176B | 2023-05 | 多语 | 通用 | [🤗HF] | bloomchat | SambaNova Systems | CD | Blog |
BiLLa | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | BiLLa | Zhongli Li | CD | |
Bactrian-X | 7/13B | 2023-05 | 多语 | 通用 | [🤗HF] | bactrian-x | MBZUAI | CD | |
Bactrian-ZH | 7B | 2023-05 | 中文 | 通用 | [🤗HF] | bactrian-x | MBZUAI | CD | |
ChatFlow | 7/13B | 2023-05 | 中英 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | |
OpenBuddy | 7/13B | 2023-05 | 多语 | 通用 | [🤗HF] | OpenBuddy | OpenBuddy | CD | |
YuYan-dialogue | 11B | 2023-04 | 中文 | 通用 | [🤗HF] | / | 网易伏羲 | CD | paper |
Moss-moon-003-sft-plugin | 16B | 2023-04 | 中英 | 通用 | [🤗HF] | MOSS | 复旦大学 | CD | |
moss-moon-003-sft | 16B | 2023-04 | 中英 | 通用 | [🤗HF] | MOSS | 复旦大学 | CD | |
RWKV-4-Raven | 3/7/14B | 2023-04 | 中英 | 通用 | [🤗HF] | ChatRWKV | BlinkDL | RNN | Blog |
Phoenix-inst-chat | 7B | 2023-04 | 中文 | 通用 | [🤗HF] | LLMZoo | 香港中文大学 | CD | |
Phoenix-chat | 7B | 2023-04 | 中文 | 通用 | [🤗HF] | LLMZoo | 香港中文大学 | CD | |
ChatPLUG | 3.7B | 2023-04 | 中文 | 通用 | [🤗HF] | ChatPLUG | 阿里巴巴 | ED | Paper |
Chinese-Alpaca | 13B | 2023-04 | 中文 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | |
BELLE-LLAMA | 13B | 2023-04 | 中文 | 通用 | [🤗HF] | BELLE | 贝壳 | CD | |
LLaMA-tuned | 7/13/ 33/65B | 2023-04 | 中文 | 通用 | [🤗HF] | LMFlow | 香港科技大学 | CD | |
Chinese-Vicuna | 7/13B | 2023-03 | 中文 | 通用 | [🤗HF] | Chinese-Vicuna | Facico | CD | |
ChatYuan-V2 | 0.7B | 2023-03 | 中英 | 通用 | [🤗HF] | ChatYuan | 元语智能 | ED | |
Chinese-Alpaca | 7B | 2023-03 | 中文 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | |
Luotuo | 7B | 2023-03 | 中文 | 通用 | [🤗HF] | Chinese-alpaca-lora | 华中师范大学 | CD | |
BELLE-LLAMA | 7B | 2023-03 | 中英 | 通用 | [🤗HF] | BELLE | 贝壳 | CD | |
ChatGLM | 6B | 2023-03 | 中英 | 通用 | [🤗HF] | ChatGLM-6B | 清华大学 | ND |
Domain-ChatLLM
开源的垂直领域对话大模型
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 架构 | 文献 |
---|---|---|---|---|---|---|---|---|---|
ChemDFM | 13B | 2024-03 | 中英 | 化学 | 🤗HF | / | OpenDFM | CD | Paper |
starcoder2 | 3/7/15B | 2024-02 | 中英 | 代码 | 🤗HF | starcoder2 | bigcode-project | CD | Paper |
TuringMM-Chat | 34B | 2024-02 | 中英 | 教育 | 🤗HuggingFace 🤖ModelScope | / | 光年无限 | CD | |
deepseek-moe | 16B | 2024-01 | 中英 | 代码 | [🤗HF] | DeepSeekMoE | DeepSeek | CD-MOE | |
Code Millenials | 1/3/ 13/34B | 2023-01 | 多语 | 代码 | [🤗HF] | code-millenials | BudEcosystem | CD | |
WizardCoder | 15/33B | 2024-01 | 多语 | 代码 | [🤗HF] | WizardLM | operatorx | CD | Paper |
DeepSeek-Coder | 1/7/33B | 2023-11 | 中英 | 代码 | [🤗HF] | DeepSeek-Coder | deepseek-ai | Blog | |
Phind | 34B | 2023-10 | 多语 | 代码 | [🤗HF] | / | Phind | CD | Blog zh |
Tongyi-Finance-Chat | 14B | 2023-11 | 中文 | 金融 | ModelScope | 通义金融-14B-Chat | 通义金融大模型 | CD | |
Skywork-math | 13B | 2023-10 | 中文 | 数学 | [🤗HF] | Skywork | SkyworkAI | CD | Paper |
XuanYuan-Chat | 70B | 2023-10 | 中英 | 金融 | [🤗HF] | XuanYuan | Duxiaoman度小满 | CD | |
zhilu | 13B | 2023-10 | 中英 | 金融 | [🤗HF] | / | SYSU-MUCFC-FinTech-Research-Center | CD | |
TestGPT | 7B | 2023-10 | 中文 | 测试 | [🤗HF] | Test-Agent | codefuse-ai | CD | |
cross | 7/13B | 2023-10 | 多语 | 数学 | [🤗HF] | / | Mathoctopus | CD | |
CodeFuse | 13/14/ 15/34B | 2023-10 | 中文 | 代码 | [🤗HF] | MFTCoder | codefuse-ai | CD | |
Taiyi | 7B | 2023-10 | 中英 | 医学 | [🤗HF] | Taiyi-LLM | DUTIR-BioNLP | CD | |
CodeShell-chat | 7B | 2023-10 | 中英 | 代码 | [🤗HF] | codeshell | WisdomShell | CD | |
DISC-LawLLM | 13B | 2023-09 | 中文 | 法律 | [🤗HF] | / | ShengbinYue | CD | Report |
WiNGPT-chat | 7B | 2023-09 | 中文 | 医学 | [🤗HF] | WiNGPT2 | Winning Health AI Research | CD | |
ziya-coding | 15/34B | 2023-09 | 中英 | 代码 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | |
AgriGPT | 6/13b | 2023-09 | 中文 | 农业 | [🤗HF] | AgriGPTs | AgriGPTs | ||
XuanYuan-chat | 70B | 2023-09 | 中文 | 金融 | TODO | XuanYuan | 度小满 | CD | Report |
夫子•明察 | 6B | 2023-09 | 中文 | 司法 | [🤗HF] | fuzi.mingcha | 山东大学 | ND | |
仲景 | 13B | 2023-09 | 中文 | 医学 | [🤗HF] | Zhongjing | Songhua Yang | CD | Paper |
CodeFuse | 13/34B | 2023-09 | 中英 | 代码 | [🤗HF] | MFTCoder | codefuse-ai | CD | |
EcomGPT | 7B | 2023-09 | 中英 | 电商 | TODO | EcomGPT | Alibaba | ||
DISC-MedLLM | 13B | 2023-08 | 中文 | 医疗 | [🤗HF] | DISC-MedLLM | FudanDISC | CD | Paper |
K2 | 7B | 2023-08 | 中英 | 科学 | [🤗HF] | k2 | daven | CD | |
CodeLLAma | 7/13/34B | 2023-08 | 多语 | 代码 | [🤗HF] | codellama | Meta Research | CD | Paper |
sqlcoder | 15B | 2023-08 | 中英 | 代码 | [🤗HF] | sqlcoder | Defog.ai | CD | |
智海-录问 | 7B | 2023-08 | 中文 | 法律 | [🤗HF] | wisdomInterrogatory | zhihaiLLM | CD | |
WizardMath-V1.0 | 7/13/70B | 2023-08 | 多语 | 数学 | [🤗HF] | WizardLM | operatorx | CD | |
QiaoBan | 7B | 2023-08 | 中文 | 情感 | [🤗HF] | QiaoBen | 哈尔滨工业大学 | ||
HuangDi | 13B | 2023-08 | 中文 | 中医 | [🤗HF] | HuangDI | Zlasejd | CD | |
ZhongJing | 2023-08 | 中文 | 中医 | TODO | CMLM-ZhongJing | 复旦大学 | |||
TCMLLM | 6B | 2023-08 | 中文 | 中医 | [🤗HF] | TCMLLM | 2020MEAI | ND | |
AutoAudit | 7B | 2023-07 | 中文 | 安全 | [🤗HF] | AutoAudit | Jiaying Li | CD | |
Lychee | 10B | 2023-07 | 中文 | 法律 | [🤗HF] | lychee_law | davidpig | ND | |
IvyGPT | 6B | 2023-07 | 中文 | 医学 | [🤗HF] | IvyGPT | WangRongsheng | ||
MING | 7B | 2023-07 | 中文 | 医学 | [🤗HF] | MING | 上海交通大学 | CD | |
Mozi | 7B | 2023-07 | 中英 | 科技 | [🤗HF] | science-llm | GMFTBY | CD | |
StarGLM | 6B | 2023-07 | 中文 | 天文 | [🤗HF] | StarGLM | LI YUYANG | ND | |
TransGPT | 7B | 2023-07 | 中英 | 交通 | [🤗HF] | TransGPT | 北京交通大学 | CD | |
CodeGeeX2 | 6B | 2023-07 | 中英 | 代码 | [🤗HF] | CodeGeeX2 | 清华大学 | ND | |
Yayi-llama2 | 7/13B | 2023-07 | 中英 | 舆情 | [🤗HF] | Yayi | 中科闻歌 | CD | |
Ziya-Writing | 13B | 2023-07 | 中英 | 写作 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | |
MindChat | 13B | 2023-07 | 中文 | 心理 | [🤗HF] | MindChat | 华东理工大学 | CD | |
ShenNong-TCM-LLM | 7B | 2023-07 | 中英 | 医学 | [🤗HF] | ShenNong-TCM-LLM | michael-wzhu | CD | |
ailawyer | 13B | 2023-07 | 中英 | 法律 | [🤗HF] | JurisLMs | openkg | CD | |
educhat | 7B/13B | 2023-06 | 中英 | 教育 | [🤗HF] | EduChat | 华东师范大学 | CD | |
Sunsimiao | 7B | 2023-06 | 中英 | 医学 | [🤗HF] | Sunsimiao | 华东理工大学 | CD | |
Media LLaMA | 7B | 2023-06 | 中文 | 媒体 | baidu | Media-LLaMA | 智媒开源研究院 | CD | |
PULSE | 7/14B | 2023-06 | 中文 | 医学 | [🤗HF] | PULSE | OpenMEDLab | CD | |
ChatLaw | 13/33B | 2023-06 | 中文 | 法律 | [🤗HF] | ChatLaw | 北京大学 | CD | |
BaoLuo | 6B | 2023-06 | 中文 | 法律 | [🤗HF] | BaoLuo-LawAssisant | LeiZi | ND | |
CoLLaMA | 7B | 2023-06 | 中英 | 代码 | [🤗HF] | CoLLaMA | Denilah | CD | |
TechGPT | 7B | 2023-06 | 中英 | 教育 | [🤗HF] | TechGPT | 东北大学 | CD | |
Yayi | 7B | 2023-06 | 中英 | 舆情 | [🤗HF] | Yayi | 中科闻歌 | CD | |
MeChat | 6B | 2023-06 | 中文 | 医学 | [🤗HF] | smile | qiuhuachuan | ND | |
ziya-medical | 13b | 2023-06 | 中英 | 医学 | [🤗HF] | MedicalGPT | Ming Xu | CD | |
Taoli | 7B | 2023-06 | 中英 | 教育 | 待开源 | taoli | 北京语言大学 | CD | |
Lawyer-llama | 13B | 2023-06 | 中英 | 法律 | [🤗HF] | lawyer-llama | Quzhe Huang | CD | |
QiZhen-CaMA | 13B | 2023-06 | 中英 | 医学 | [🤗HF] | QiZhenGPT | 浙江大学 | CD | |
扁鹊-2.0 | 6B | 2023-06 | 中文 | 医学 | [🤗HF] | BianQue | 华南理工大学 | ND | |
SoulChat | 6B | 2023-06 | 中文 | 心理 | [🤗HF] | SoulChat | 华南理工大学 | ND | |
HanFei | 7B | 2023-05 | 中文 | 法律 | baidu-d6t5 | HanFei | 中国科学院深圳先进院 | CD | |
QiZhen | 6B | 2023-05 | 中英 | 医学 | [baidu] | QiZhenGPT | 浙江大学 | CD | |
ChatMed-Consult | 7B | 2023-05 | 中英 | 医学 | [🤗HF] | ChatMed | michael-wzhu | CD | |
LaWGPT-beta1.1 | 7B | 2023-05 | 中英 | 法律 | [🤗HF] | LawGPT | Pengxiao Song | CD | |
Cornucopia | 7B | 2023-05 | 中英 | 金融 | [🤗HF] | Cornucopia-LLaMA-Fin-Chinese | yuyangmu | CD | |
HuatuoGPT | 7B | 2023-05 | 中文 | 医学 | [🤗HF] | HuatuoGPT | 香港中文大学 | CD | Paper |
LexiLaw | 6B | 2023-05 | 中文 | 法律 | [🤗HF] | LexiLaw | Haitao Li | ND | Paper |
XuanYuan | 176B | 2023-05 | 中文 | 金融 | 申请 | XuanYuan | 度小满 | CD | Paper |
LawGPT | 6B | 2023-05 | 中文 | 法律 | [🤗HF] | LAW-GPT | hongchengliu | N | |
扁鹊-1.0 | 0.7B | 2023-04 | 中文 | 医学 | [🤗HF] | BianQue | scutcyr | ED | |
ChatGLM-Med | 6B | 2023-04 | 中文 | 医学 | [🤗HF] | Med-ChatGLM | 哈尔滨工业大学 | ED | |
BenTsao | 7B | 2023-04 | 中文 | 医学 | [🤗HF] | Huatuo-Llama-Med-Chinese | 哈尔滨工业大学 | CD | |
DoctorGLM | 6B | 2023-04 | 中文 | 医学 | TODO | DoctorGLM | xionghonglin | ND | |
Firefly | 1/2/7B | 2023-04 | 中文 | 文化 | [🤗HF] | Firefly | Yang JianXin | CD | |
ChatRWKV | 7B | 2023-01 | 中英 | 小说 | [🤗HF] | ChatRWKV | BlinkDL | RNN | Blog |
MultiModal-ChatLLM
收集包含中文的多模态大模型,具备对话等功能。
模型 | 大小 | 时间 | 语言模型 | 非语言模型 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 文献 |
---|---|---|---|---|---|---|---|---|---|---|
DeepSeek-VL | 1.3/7B | 2024-03 | DeepSeek | SigLip/SAM | 中英 | 图文 | 🤗HF | DeepSeek-VL | deepseek-ai | Paper |
OmniLMM | 3/12B | 2024-02 | MiniCPM | SigLip | 中英 | 图文 | 🤗HF | OmniLMM | [OpenBMB](https://github.com/01-ai) | |
MiniCPM-V | 3B | 2024-02 | MiniCPM-2.4B | SigLip-400M | 中英 | 图文 | 🤗HF | OmniLMM | [OpenBMB](https://github.com/01-ai) | |
Yi-VL | 6/34B | 2024-01 | Yi | CLIP-VIT | 中英 | 图文 | [🤗HF] | Yi | 01-ai | |
Lyrics | 14B | 2023-12 | / | / | 中英 | 图文 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | |
Qwen-Audio | 7B | 2023-12 | Qwen-7B | Whisper-large-v2 | 中英 | 文音 | [🤗HF] | Qwen-Audio | Qwen | Paper |
SPHINX | 13B | 2023-10 | / | / | 中英 | 图文 | [🤗HF] | LLaMA2-Accessory | Alpha-VLLM | |
Skywork-MM | 13B | 2023-10 | / | / | 中英 | 图文 | [🤗HF] | Skywork | SkyworkAI | Paper |
CogVLM | 7/14B | 2023-10 | Qwen | ViT | 中英 | 图文 | [🤗HF] | / | CausalLM | |
fuyu | 8B | 2023-10 | / | / | 中英 | 图文 | [🤗HF] | / | Adept AI Labs | Blog |
Ziya-Visual | 14B | 2023-10 | LLaMA | InstructBLIP | 中英 | 图文 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | Paper |
CogVLM | 17B | 2023-10 | EVA2-CLIP-E | Vicuna-v1.5 | 中英 | 图文 | TODO | CogVLM | THUDM | Paper |
idefics | 9/80B | 2023-10 | LLaMA | CLIP-ViT | 中英 | 图文 | [🤗HF] | / | HuggingFaceM4 | log |
InternLM-XComposer | 7B | 2023-10 | InternLM | EVA-CLIP | 中英 | 图文 | [🤗HF] | InternLM-XComposer | InternLM | Report |
WeMix-LLM | 13B | 2023-09 | LLama2 | / | 中英 | 图文 | [🤗HF] | WeMix-LLM | Alpha-VLLM | |
Vally | 7/13B | 2023-08 | BelleGroup/BELLE-LLaMA-EXT | OFA-Sys/chinese-clip-vit-large-patch14 | 中英 | 图文 | [🤗HF] [🤗HF] | Valley | 罗瑞璞 | Paper |
SALMONN | / | 2023-08 | / | / | 中英 | 语音 | TODO | SALMONN | Bytedance | |
IDEFICS | 9/80B | 2023-08 | llama | CLIP-ViT | 中英 | 图文-通用 | [🤗HF] | m4-logs | HuggingFaceM4 | Paper |
Qwen-VL | 7B | 2023-08 | Qwen-7B | Openclip ViT-bigG | 中英 | 通用 | [🤗HF] | Qwen-VL | 阿里云 | |
Qwen-VL-chat | 7B | 2023-08 | Qwen-7B | Openclip ViT-bigG | 中英 | 通用 | [🤗HF] | Qwen-VL | 阿里云 | |
LLasM | 7B | 2023-07 | Chinese-Llama2 | whisper-large-v2 | 中英 | 语音 | [🤗HF] | LLaSM | 北京灵琐 | |
Chinese-LLaVA | 7B | 2023-07 | Chinese-Llama2 | Clip-vit | 中英 | 视觉 | [🤗HF] | Chinese-LLaVA! | 北京灵琐 | |
RemoteGLM | 6B | 2023-07 | VisualGLM-6B | VisualGLM-6B | 中文 | 遥感 | TODO | RemoteGLM | lzw-lzw | |
VisualCLA | 7B | 2023-07 | Chinese-Alpaca-Plus | CLIP-ViT-L/14 | 中文 | 视觉 | [🤗HF] | Visual-Chinese-LLaMA-Alpaca! | Ziqing Yang | |
yuren | 7B | 2023-07 | baichuan-7B | CLIP | 中英 | 视觉 | [🤗HF] | yuren-baichuan-7b | Pleisto | |
VisCPM-Chat | 10B | 2023-06 | CPM-Bee | Q-Former | 中英 | 视觉 | [🤗HF] | VisCPM | OpenBMB | |
VisCPM-Paint | 10B | 2023-06 | CPM-Bee | Stable Diffusion 2.1 | 中英 | 视觉 | [🤗HF] | VisCPM | OpenBMB | |
XrayPULSE | 7B | 2023-06 | PULSE | MedCLIP | 中文 | 医学 | [🤗HF] | XrayPULSE | OpenMEDLab | |
SEEChat | 6B | 2023-06 | ChatGLM | CLIP-ViT | 中文 | / | [🤗HF] | SEEChat | 360 | |
Ziya-BLIP2-14B-Visual-v1 | 14B | 2023-06 | LLaMA-13B | BLIP2 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM! | IDEA研究院 | |
Video-LLaMA-BiLLA | 7B | 2023-05 | BiLLa-7B | MiniGPT-4 | 中英 | 通用 | [🤗HF] | Video-LLaMA | 达摩院多语言NLP | Paper |
Video-LLaMA-Ziya | 13B | 2023-05 | Ziya-13B | MiniGPT-4 | 中英 | 通用 | [🤗HF] | Video-LLaMA | 达摩院多语言NLP | Paper |
XrayGLM | 6B | 2023-05 | ChatGLM-6B | BLIP2-Qformer | 中英 | 医学 | [🤗HF] | XrayGLM | 澳门理工大学 | |
X-LLM | 2023-05 | ChatGLM | ViT-g | 中文 | / | TODO | X-LLM | Paper | ||
VisualGLM | 6B | 2023-05 | ChatGLM-6B | BLIP2-Qformer | 中英 | 视觉 | [🤗HF] | VisualGLM-6B![ |
中文指令数据集
收集包含中文的指令数据集,用于微调语言模型。
名称 | 大小 | 时间 | 语言 | 下载 | 项目地址 | 作者 | 备注 |
---|---|---|---|---|---|---|---|
FinCorpus | 50G | 2023-09 | 中文 | dataset | XuanYuan | 度小满 | 金融领域 |
TransGPT-sft | 346k | 2023-07 | 中文 | dataset | TransGPT | 北京交通大学 | |
TransGPT-pt | 58k | 2023-07 | 中文 | dataset | TransGPT | 北京交通大学 | |
ShareGPT-Chinese-English | 90K | 2023-07 | 中英 | dataset | llama2-Chinese-chat![ | Ke Bai | |
educhat-sft-002-data-osm | 400w | 2023-06 | 中英 | dataset | EduChat | 华东师范大学 | 教育 |
chatgpt-corpus | 3M | 2023-06 | 中文 | dataset | chatgpt-corpus | plex | |
Simle | 350k | 2023-06 | 中文 | dataset | smile | qiuhuachuan | 心理健康 |
QiZhen | 20k | 2023-06 | 中文 | dataset | QiZhenGPT | 浙江大学 | 医学 |
BayLing-80 | 80 | 2023-06 | 中英 | dataset | BayLing | 中国科学院 | 多轮指令 |
Tigerbot-dataset | 120k | 2023-06 | 中英 | dataset | TigerBot | 虎博科技 | |
lawyer-llama | / | 2023-05 | 中文 | dataset | lawyer-llama | Quzhe Huang | 法律 |
Bactrian-X | 67K | 2023-05 | 多语 | dataset | bactrian-x | MBZUAI | |
CrimeKgAssitant | 52k | 2023-05 | 中文 | dataset | LAW-GPT | hongchengliu | 法律 |
moss-002-sft-data | 1.1M | 2023-04 | 中英 | dataset | MOSS | 复旦大学 | |
moss-003-sft-data | 1.1M | 2023-04 | 中英 | dataset | MOSS | 复旦大学 | |
moss-003-sft-plugin-data | 300K | 2023-04 | 中英 | dataset | MOSS | 复旦大学 | |
Safety-Prompts | 100K | 2023-04 | 中文 | dataset | Safety-Prompts | 清华大学 | 评测平台 |
OASST1 | / | 2023-04 | 多语 | dataset | Open-Assistant | OpenAssistant | |
ShareChat | 90K | 2023-04 | 中英 | dataset | ShareChat | czhko | |
GPT-4-LLM | 52K | 2023-04 | 中文 | dataset | GPT-4-LLM | Instruction-Tuning-with-GPT-4 | paper |
COIG | 200K | 2023-04 | 中文 | dataset | FlagInstruct | BAAI | paper |
RedGPT | 50k | 2023-04 | 中文 | dataset | RedGPT | MiniGPT | |
shareGPT_cn | 20k | 2023-04 | 中文 | dataset | shareGPT_cn | shareAI | |
generated_chat_0.4M | 0.4M | 2023-04 | 中文 | dataset | BELLE | Ke Technologies | 角色对话 |
multiturn_chat_0.8M | 0.8M | 2023-04 | 中文 | dataset | BELLE | Ke Technologies | 多轮任务 |
school_math_0.25M | 0.25M | 2023-04 | 中文 | dataset | BELLE | Ke Technologies | 数学题 |
Zhihu-KOL | / | 2023-03 | 中文 | dataset | Zhihu-KOL | Rui Wang | |
InstructionWild | 104k | 2023-03 | 中英 | dataset | InstructionWild | Xue Fuzhao | |
Alpaca-CoT | /. | 2023-03 | 中英 | dataset | Alpaca-CoT | Qingyi Si | |
GuanacoDataset | / | 2023-03 | 多语 | dataset | guanaco-model | Guanaco | |
Traditional-Chinese-alpaca | 52K | 2023-03 | 中文 | dataset | Traditional-Chinese Alpaca | NTU NLP Lab | gpt翻译 |
alpaca_chinese_dataset | / | 2023-03 | 中文 | dataset | alpaca_chinese_dataset | akou | 人工校验 |
alpaca-chinese-dataset | / | 2023-03 | 中文 | dataset | alpaca-chinese-dataset | carbonz | 机器翻译 |
train_2M_CN | 2M | 2023-03 | 中文 | dataset | BELLE | Ke Technologies | |
train_1M_CN | 1M | 2023-03 | 中文 | dataset | BELLE | Ke Technologies | |
train_0.5M_CN | 0.5M | 2023-03 | 中文 | dataset | BELLE | Ke Technologies | |
HC3 人类-ChatGPT 问答 | / | 2023-03 | 中文 | dataset | chatgpt-comparison-detection | SimpleAI | |
firefly-train-1.1M | 1.1M | 2023-03 | 中文 | dataset | Firefly | Jianxin Yang |
Embedding
MTEB排行榜: https://huggingface.co/spaces/mteb/leaderboard 镜像
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 文 |
---|---|---|---|---|---|---|---|---|
BCE | 279M | 2024-01 | 多语 | 通用 | [🤗HF] | BCEmbedding | netease-youdao | |
Cohere | Base | 2023-09 | 多语 | 通用 | [🤗HF] | / | Cohere | Blog |
jina | Base | 2023-10 | 中英 | 通用 | [🤗HF] | / | Jina AI | |
Dmeta | 400MB | 2024-02 | 中文 | 通用 | [🤗HF] | / | DMetaSoul | |
bge-m3 | 2024-02 | 中文 | 通用 | [🤗HF] | / | BAAI | Paper | |
tao-8k | 2023-11 | 中文 | 通用 | [🤗HF] | amu | |||
bge | s/b/l | 2023-10 | 中文 | 通用 | [🤗HF] | / | BAAI | |
gte-zh | s/b/l | 2023-08 | 中文 | 通用 | [🤗HF] | / | Alibaba DAMO | Paper |
m3e | s/b/l | 2023-06 | 中文 | 通用 | [🤗HF] | / | Moka-AI | |
LaBSE | 多语 | 通用 | [🤗HF] | / | Sentence Transformers |
大模型评估基准
1. C-Eval ![
C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,查看论文了解更多细节。
2. FlagEval ![
FlagEval是一个面向AI基础模型的评测工具包。我们的目标是探索和集合科学、公正、开放的基础模型评测基准、方法及工具,对多领域(如语言、语音、视觉及多模态)的基础模型进行多维度(如准确性、效率、鲁棒性等)的评测。我们希望通过对基础模型的评测,加深对基础模型的理解,促进相关的技术创新及产业应用。
3. SuperCLUElyb ![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
SuperCLUE琅琊榜,这是一个中文通用大模型对战评价基准,它以众包的方式提供匿名、随机的对战。在本文中,我们发布了初步的结果和基于Elo评级系统的排行榜,Elo评级是国际象棋和其他竞技游戏中广泛使用的评级系统。我们邀请整个社区加入这项工作,贡献新的模型,并通过提问和投票选出你最喜欢的答案来评估它们。
4. XiezhiBenchmark ![
该基准包括来自13个不同学科的516个学科的220,000个多项选择题,以及15,000个来自单一学科和多个学科的问题。我们对47个最新的大型语言模型在Xiezhi上进行了评估,结果表明在科学、工程、农学、医学和艺术等领域,大型语言模型的表现超过了人类的平均水平,但在经济学、法学、教育学、文学、历史和管理学等领域,人类的表现仍然远远超过了大型语言模型。
5. Open LLM Leaderboard
由HuggingFace组织的一个LLM评测榜单,目前已评估了较多主流的开源LLM模型,以英文为主。主要目标是跟踪、排名和评估最新的大语言模型和聊天机器人,让所有人方便的观察到开源社区的进展和评估这些模型。这个排行榜有一个关键优势,社区中的任何成员都可以提交模型,并在 Hugging Face 的 GPU 集群上自动评估。
[官方网站]
6. 中文大模型安全评测平台 ![外
大模型安全测评依托于一套系统的安全评测框架,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的40余个二级安全类别。
7. OpenCompass大语言模型评测 !
OpenCompass 是一款开源、高效、全面的评测大模型体系及开放平台。我们提供完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测。利用分布式技术,即使面对千亿参数模型也能在数小时内完成评测。基于多个不同维度的高认可度数据集开放多样化的评测方式,包括零样本评测、小样本评测和思维链评测,全方位量化模型各个维度能力。
在线体验大模型
注:需要申请或者注册方可体验,更多见Github
1. ChatGPT–OpenAI
OpenAI所提出的GPT相关模型,也是目前最火的大语言模型,发布版本已经到了4.0.
[官方网站]
2. New bing–微软
NewBing是微软在2023年3月推出的一款全新的搜索引擎,它基于OpenAI的大型语言模型(LLM),并结合了ChatGPT和DALL·E的技术,为用户提供了一个AI驱动的网络助手。
[官方网站]
3. 文心一言–百度
百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
[官方网站]
4. 通义大模型–阿里
阿里大模型统一品牌,覆盖语言、听觉、多模态等领域致力于实现接近人类智慧的通用智能,让AI从“单一感官”到“五官全开”
[官方网站]
5. 星火认知大模型–科大讯飞
科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
[官方网站]
6. Claude–Anthropic
Claude,是人工智能初创公司Anthropic 发布的一款类似ChatGPT的产品。
[官方网站]
7. ChatGLM–智谱AI
基于千亿基座模型 GLM-130B,注入代码预训练,通过有监督微调等技术实现人类意图对齐,具备问答、多轮对话、代码生成功能的中英双语大模型。
[官方网站]
8. 天工大模型–昆仑万维
天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。
[官方网站]
9. 序列猴子大模型–出门问问
序列猴子大模型是一个具有长序列、多模态、单模型、大数据等特点的超大规模语言模型,基于其通用的表示能力与推理能力,能够进行多轮交互,打造更便捷流畅的用户体验,极大地提高了生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。
[官方网站]
10. MOSS–复旦大学
MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型
[官方网站]
11. 360智脑大模–360
360智脑的生成与创作、多轮对话、代码能力、阅读理解、逻辑与推理、多模态等十大核心能力可覆盖大模型全部应用场景。
[官方网站]
12. 曹植GPT大语言模型–达观数据
达观数据积极探索大语言模型LLM的实践,研发国产版GPT“曹植”系统,作为垂直、专用、自主可控的国产版ChatGPT模型,不仅实现专业领域的AIGC智能化应用,且可内置在客户各类业务系统中提供专用服务
[官方网站]
13. 日日新–商汤
商汤“日日新SenseNova”大模型体系,正式问世
不仅展示了大模型体系下的语言大模型,还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,还揭开了依托商汤AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。
[官方网站]
14. 天燕大模型–APUS
天燕大模型是APUS公司自研的多模态大模型(LMM),具备对文本、图像、视频、音频的理解和生成能力(视频和音频的能力即将推出)。
[官方网站]
15. 元乘象–智子引擎
图文机器人
[官方网站]
16. 西湖大模型–西湖心辰
[官方网站]
17. Dongni–深思考
AI多模态搜索引擎
[官方网站]
18. 山海大模型–云知声
只需一次对话即可获取信息、知识和灵感,解决需求。是每个人身边的助理、朋友和专家。
[官方网站]
19. MiniMax大模型–MiniMax
MiniMax 最新一代的中文大语言模型帮助人类高效写作、激发创意、获取知识、做出决策现已对企业开放API体验
[官方网站]
开源模型库平台
- 🤗HuggingFace: The AI community building the future.
- 模型下载地址: https://huggingface.co/models
- ModelScope: ModelScope平台是以模型为中心的模型开源社区
- 模型下载地址:https://modelscope.cn/models
- flagopen: flagopen飞智大模型技术开源体系
- 模型下载地址: https://model.baai.ac.cn/models
- 始智AI: 中国AI开源创新社区
- 模型下载地址: https://wisemodel.cn/models
开源数据集库
- huggfaceing数据集仓库: https://huggingface.co/datasets
- 包含了自然语言处理、计算机视觉、语音、多模态等数据集,内置100多个多语言公共数据集下载
- ModelScope数据集仓库:https://modelscope.cn/datasets
- 提供了覆盖自然语言处理、计算机视觉、语音、多模态等数据集,更有阿里巴巴集团贡献的专业领域数据集,
- flagopen数据集仓库: https://data.baai.ac.cn/data
- 内置公共数据集下载,可下200G大规模预训练语料WuDaoCorpora
- cluebenchmarks数据集仓库:https://www.cluebenchmarks.com/dataSet_search.html
- 多个中英文NLP数据集,并可申请下载100GB的高质量中文预训练语料CLUECorpus2020
- MNBVC: Massive Never-ending BT Vast Chinese corpus
- 超大规模中文语料集
- OpenDataLab数据集仓库: https://opendatalab.com/
- OpenDataLab 是有影响力的数据开源开放平台,公开数据集触手可及。
- OSCAR: Open Super-large Crawled Aggregated coRpus, 多语言数据集
- 最新版本包含1.4T的中文语言数据集
参考链接
https://github.com/lonePatient/awesome-pretrained-chinese-nlp-models