Bootstrap

一文了解GPT-4o mini:成本低、性能高、支持128K上下文,开发者必备利器!

一文了解GPT-4o mini:成本低、性能高、支持128K上下文,开发者必备利器!

前言

QQ截图20240717143114.png

GPT-4o mini

OpenAI 刚刚官宣了一则重磅消息:全新的"迷你"大语言模型 GPT-4o mini 正式上线!这一次,OpenAI 在 AI 领域又一次掀起了波澜。GPT-4o mini 不仅继承了 GPT-4o 的强大性能,还以更低廉的成本、更小巧的体积,为开发者和企业用户提供了一个高性价比的选择。

GPT-4o mini的价位

QQ截图20240719143409.png

更低的价位

目前 GPT-4o mini 能支持高达 128K tokens 的上下文输入,输出长度也能达到 16K tokens 。如果说 GPT-4o 是一位全能选手,那么 GPT-4o mini 就是一位"小个子"运动员,在某些特定项目上的表现甚至更加出色。

更让人惊喜的是 GPT-4o mini 的定价。根据 OpenAI 官网信息,其输入价格仅为15美分/百万 tokens ,输出60美分/百万 tokens 。相比之下,此前备受欢迎的 GPT-3.5 Turbo 的价格是50美分/百万 tokens 和150美分/百万 tokens 。而顶级旗舰模型 GPT-4o 的价格就更高了,输入5美元/百万 tokens ,输出15美元/百万 tokens 可以说,GPT-4o mini 的推出,让高质量的 AI 模型变得更加"平民化"。

GPT-4o mini性能测试

QQ截图20240719143500.png

性能对比

GPT-4o mini 在各项性能测试中均取得了优异的成绩。在 MMLU 测试中,它获得了82%的高分,超越同级别的 Gemini Flash(77.9%)和 Claude Haiku(73.8%),甚至逼近顶级模型 GPT-4o(88.7%)的水准。

在数学和编程能力方面,GPT-4o mini 同样表现抢眼。MGSM 和 HumanEval 的测试中,GPT-4o mini 分别以87.0%和87.2%的成绩领跑小模型阵营,将 Gemini Flash 和 Claude Haiku 远远甩在身后。

即使在更有挑战性的多模态推理测试 MMMU 中,GPT-4o mini 依然以59.4%的成绩力压群雄。而在 LMSYS 排行榜上,它的聊天偏好评分甚至还要优于"大哥" GPT-4。这个"小个子"展现出了惊人的潜力。

GPT-4o mini的安全性

作为首个使用"指令层次结构"安全策略的AI模型,GPT-4o mini在追求高性能和低成本的同时,也更加注重用户的安全。OpenAI邀请了70多位跨领域专家对GPT-4o进行了风险评估,并根据反馈对模型进行了优化,提高了模型的鲁棒性,让输出更加可靠。

OpenAI通过改进模型结构、优化训练数据和训练流程等一系列技术创新,在保证性能的同时成功地降低了成本。相比两年前的text-davinci-003模型,如今GPT-4o mini的每token成本已经下降了99%。这一突破性的进展,让AI民主化进程大大加速。

总结

强大的性能、亲民的价格、灵活的部署,GPT-4o mini具备成为开发者必备利器的一切潜质。128K的超长上下文支持,更是让它在对话、写作等场景中的表现更加出色。GPT-4o mini的到来,预示着AI技术正迎来新的篇章。

厚德云是一款专业的AI算力云平台,为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;