关注我, AI 学习之旅上,我与您一同成长!
5 月 14 日,中国时间凌晨 1 点,迎来了 OpenAI 又一次重拳出击,期待了一周多的发布会,终于揭开面纱。
这个如 Altman 口中 “就像魔法一样的东西” – 全能大模型 GPT-4o 的功能强大到让人破音 ~
简单总结下发布会的内容:
- 推出全能模型 – GPT-4o,
- 宣布 GPT-4o 免费对外开发(无论是 plus 用户,还是免费用户)
- GPT-4o API , 相比于 GPT-4 turbo,速度快 2 倍、价格更便宜、有 5 倍访问限制
- 即将推出全新的 UI 界面 + 桌面客户端。
一、GPT-4o 功能介绍
一)什么是 GPT-4o?
GPT-4o,里面的 o 指单词 Omni,源自拉丁语中的词 “omnis”, omnis 通常被用来表示—— 全能、无所不知、无所不在的。
因此,GPT-4o 可以被称为全能模型。
它是在 GPT-4 的基础上升级的模型,从文本、视觉以及音频方面进行全面提升。
二)GPT-4o 有什么特别的能力?
GPT-4o 能接受文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出。
需要强调的是,不仅仅文字,还包括音频、图像和视频,难以想象,这又将颠覆多少行业~
我们来看几个官方提供的案例:
1、与 GPT-4o 视频对话
2、要求 GPT-4o 实时翻译
3、当小狗遇见 GPT-4o
4、面试准备
5、过生日
三)与过去的 AI 对话相比,GPT-4o 有哪些优势?
过去,我们与 AI 的对话基本都是你说一句、它回一句,说话时不能中断,明显是人跟机器之间的聊天。
而 GPT-4o 的语音对话不仅可以随时干涉、随时中断,还能实时响应、没有延迟。
相比于 GPT-4 在语音方面树懒般的速度,GPT-4o 可以用“猎豹”来形容~
此外,它还能理解并模拟你的情绪,这有点太强了~
四)GPT-4o 在文本和代码处理上表现如何?
基本上与 GPT-4 Turbo 的性能打个平手,但是在非英语文本上的表现能力更强。
二、对所有人完全免费
不仅仅是 GPT-4o 免费,更刺激的是 GPT Store、Vision (包含代码解释器、联网功能等)都会陆续开放出来。
除了要为一直诟病 GPT-4 价格过高的小伙伴欢呼之外,更得为很多收费的大模型捏把汗了~
当然 Plus 用户会享受到更高的使用次数,接下来,也可以体验到桌面版和语音对话功能。
PS:根据官方信息,视频和语音功能,未来几周将会陆续推送,大家需要耐心等待~
三、GPT-4o API
2倍快、5倍访问限制,半价(VS 4-turbo),128k 上下文。
GPT-4o:
输入:$5.00 / 1M tokens
输出:$15.00 / 1M tokens
GPT-4-turbo:
输入:$10.00 / 1M tokens
输出:$30.00 / 1M tokens
四、全新UI、桌面客户端
几天前,全新 UI 就已经有消息了。关于桌面客户端,过去就有很多小伙伴问到,我一直没有 get 到价值,不过 存在即合理。
桌面客户端今天已经开始推送了,大家可以留意下。
五、总结
这次着实被 GPT-4o 的实时交互能力震撼到了。人类与机器的交互革新该留下 “Open AI、GTP-4o” 的名字~
冰山之所以壮观,不仅仅是它露出水面的一角,更因为那些支撑它,赋予它力量的水下部分。
这次更新,无论官方宣传得多么炸裂,真正体现价值的还得是应用场景。
期待,未来几天,大家脑洞大开的场面~
如果觉得不错,随手点个赞、收藏、转发三连吧。谢谢你看我的文章 ~
关注公众号,后台回复 “提示词”,可免费领取更多实用 AI 提示词资料 !!!