免费！免费！免费！GPT-4o 是什么？是人类与机器交互的革新

关注我, AI 学习之旅上，我与您一同成长！

5 月 14 日，中国时间凌晨 1 点，迎来了 OpenAI 又一次重拳出击，期待了一周多的发布会，终于揭开面纱。

这个如 Altman 口中 “就像魔法一样的东西” – 全能大模型 GPT-4o 的功能强大到让人破音～

简单总结下发布会的内容：

推出全能模型 – GPT-4o，
宣布 GPT-4o 免费对外开发（无论是 plus 用户，还是免费用户）
GPT-4o API , 相比于 GPT-4 turbo，速度快 2 倍、价格更便宜、有 5 倍访问限制
即将推出全新的 UI 界面 + 桌面客户端。

一、GPT-4o 功能介绍

一）什么是 GPT-4o？

GPT-4o，里面的 o 指单词 Omni，源自拉丁语中的词 “omnis”, omnis 通常被用来表示—— 全能、无所不知、无所不在的。

因此，GPT-4o 可以被称为全能模型。

它是在 GPT-4 的基础上升级的模型，从文本、视觉以及音频方面进行全面提升。

二）GPT-4o 有什么特别的能力？

GPT-4o 能接受文本、音频和图像的任意组合作为输入，并实时生成文本、音频和图像的任意组合输出。

需要强调的是，不仅仅文字，还包括音频、图像和视频，难以想象，这又将颠覆多少行业～

我们来看几个官方提供的案例：

1、与 GPT-4o 视频对话

2、要求 GPT-4o 实时翻译

3、当小狗遇见 GPT-4o

4、面试准备

5、过生日

三）与过去的 AI 对话相比，GPT-4o 有哪些优势？

过去，我们与 AI 的对话基本都是你说一句、它回一句，说话时不能中断，明显是人跟机器之间的聊天。

而 GPT-4o 的语音对话不仅可以随时干涉、随时中断，还能实时响应、没有延迟。

相比于 GPT-4 在语音方面树懒般的速度，GPT-4o 可以用“猎豹”来形容～

此外，它还能理解并模拟你的情绪，这有点太强了～

四）GPT-4o 在文本和代码处理上表现如何？

基本上与 GPT-4 Turbo 的性能打个平手，但是在非英语文本上的表现能力更强。

二、对所有人完全免费

不仅仅是 GPT-4o 免费，更刺激的是 GPT Store、Vision （包含代码解释器、联网功能等）都会陆续开放出来。

除了要为一直诟病 GPT-4 价格过高的小伙伴欢呼之外，更得为很多收费的大模型捏把汗了～

当然 Plus 用户会享受到更高的使用次数，接下来，也可以体验到桌面版和语音对话功能。

PS：根据官方信息，视频和语音功能，未来几周将会陆续推送，大家需要耐心等待～

三、GPT-4o API

2倍快、5倍访问限制，半价(VS 4-turbo)，128k 上下文。

GPT-4o:

输入：$5.00 / 1M tokens

输出：$15.00 / 1M tokens

GPT-4-turbo:

输入：$10.00 / 1M tokens

输出：$30.00 / 1M tokens

四、全新UI、桌面客户端

几天前，全新 UI 就已经有消息了。关于桌面客户端，过去就有很多小伙伴问到，我一直没有 get 到价值，不过 存在即合理。

桌面客户端今天已经开始推送了，大家可以留意下。

五、总结

这次着实被 GPT-4o 的实时交互能力震撼到了。人类与机器的交互革新该留下 “Open AI、GTP-4o” 的名字～

冰山之所以壮观，不仅仅是它露出水面的一角，更因为那些支撑它，赋予它力量的水下部分。

这次更新，无论官方宣传得多么炸裂，真正体现价值的还得是应用场景。

期待，未来几天，大家脑洞大开的场面～

如果觉得不错，随手点个赞、收藏、转发三连吧。谢谢你看我的文章 ~

关注公众号，后台回复 “提示词”，可免费领取更多实用 AI 提示词资料 !!!

在这里插入图片描述