Bootstrap

阿里发布通义千问2.5:一文带你读懂通义千问!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

一些结论

  1. 阿里云在AI智领者峰会上发布了通义千问2.5版本,并开源了1100亿参数模型Qwen1.5-110B

  2. 通义千问2.5在理解能力、逻辑推理、指令遵循、代码能力上分别提升了9%、16%、19%、10%,官方号称“全面赶超 GPT-4”。

  3. 在目前最新的LMSYS Chatbot Arena Leaderboard排行榜中,Qwen-Max-0428目前位列第10名,Qwen1.5-110B-Chat则为第13名。第14名是GPT-4-0613

  4. 小米的“小爱同学”宣布接入通义大模型,新东方、微博、众安保险和完美世界也与通义进行合作。

  5. 通义千问支持网页端、app,免费使用,地址见文末。

阿里一直是AI开源领域的“尖子生”。2024年5月9日,阿里云官方在AI智领者峰会中官宣了通义千问2.5版本,并开源了1100亿参数模型Qwen1.5-110B

这不是阿里第一次升级通义千问。2023年4月,阿里正式发布通义千千问。当时国内AI大模型和AI工具均处于小荷才漏尖尖角的状态。国外的ChatGPT太耀眼了,尤其是GPT-4发布后,它的能力和表现更是令人震惊。于是,国内的AI玩家们开始发力中文大模型。2023年10月,阿里发布了通义千问2.0,当时号称“性能赶超GPT-3.5”。也是在这时,通义千问开始收获用户们的注意力。

有一说一,在国内一众AI对话工具里,通义千问的体验可以说是名列前茅的,奈何它太低调。我之前也写过一些测评文章,感兴趣的朋友可以翻回去看看。更加难能可贵的是,相比网红Kimi Chat,通义千问更加重视基础模型的能力,我一直认为,基础模型能力才是一款AI工具上限的决定性因素,而不是之前大家都在卷的上下文长度。毕竟当一个维度上涨到一定程度,它的作用是边际递减的,一般用户也用不到200万字的上下文。

关于通义千问2.5

对于这次的通义千问2.5版本,阿里官方的口号是“全面赶超 GPT-4”,并表示相比上一代2.1版本,2.5在理解能力、逻辑推理、指令遵循、代码能力上分别提升了9%、16%、19%、10%。注意,阿里官方的说法是,在中文语境下,文本理解、文本生成、知识问答、生活建议、闲聊、对话和安全风险等多项能力上赶超 GPT-4。但实际使用体验还需验证。

值得一提的是,阿里官方晒出了一张LLM排行榜的截图,图中GPT-4-Turbo-1106版本和Qwen-Max-0403并列第一名。排行榜来自于上海AI实验室推出的OpenCompass。

在最新的OpenCompass排行榜中,通义系列模型的排名有所回落,但依然处于第4和第5名。(来源:https://rank.opencompass.org.cn/home)

关于Qwen1.5-110B

这里有必要解释一下通义千问和Qwen模型之间的关系。首先,通义千问是阿里云推出的LLM模型的一个统称,模型分为闭源开源两大类。闭源模型包括上面排行榜截图里的Qwen-Max-0403Qwen-Max-0107等。开源模型则包括本次AI峰会提到的1100亿参数模型Qwen1.5-110B,以及小尺寸模型0.5B、1.8B、4B、7B、14B。而我们平时基于用户角度提到的“通义千问”则是指阿里官方基于通义闭源模型推出的免费的AI对话平台,类似于GPT系列模型和ChatGPT的关系。

阿里云CTO周靖人表示:“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。” 未来通义大模型还会持续开源

通义大模型坚持开源战略,其开源的这些大模型也多次进入LLM模型排行榜前几名。我在《Claude 3 Opus超越GPT-4登顶LMSYS Leaderboard排行榜!通义大模型榜上有名!》一文中就提到过。在目前最新的LMSYS Chatbot Arena Leaderboard排行榜中,Qwen-Max-0428目前位列第10名,Qwen1.5-110B-Chat则为第13名,这在竞争极其激烈的AI大模型领域是非常不错的排名了。可以说,阿里把通义这个我国本土大模型做到了全球知名。

通义大模型的toB之路

AI设计的初衷就是提高效率,对于B端企业来说是绝配。今年4月,阿里就官宣了新东方已经接入通义大模型改善在线教学体验,提升学员满意度。

今天北京站的AI智领者峰会上,阿里官方表示通义服务的企业数量已超过9万家,而通过钉钉服务的企业更是突破了220万家,覆盖领域包括PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等。

同时,小米公司旗下的人工智能助手“小爱同学”宣布与通义大模型合作,目的是提升小爱同学在图片生成和理解方面的多模态AI能力。合作成果预计将在小米的汽车和手机等多种设备上得到应用。此外,微博、众安保险和完美世界在内的多家企业也已开始利用通义大模型。

如何使用通义千问?

通义千问支持网页端、app(我并未在微信搜索到阿里官方出的通义千问小程序)。其中,通义千问app现已更名为“通义”app。

网页端地址:https://tongyi.aliyun.com/qianwen/

App:在各大手机应用商店搜索“通义”下载安装即可。

注册登录后,即可免费使用。


通义千问相关的文章推荐

  1. 盘点那些免费的AI对话工具(国内篇):国内TOP3 AI聊天机器人产品介绍

  2. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(一)

  3. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(二)

  4. 用真实数据告诉你前10大AI对话工具排行!(国内+国外篇)

  5. Claude 3 Opus超越GPT-4登顶LMSYS Leaderboard排行榜!通义大模型榜上有名!

  6. Claude 3有点东西!这个看似简单的问题只有GPT-4和Claude 3回答正确!通义千问和讯飞星火表现同样亮眼!

  7. 谷歌Gemini 1.5 Pro向所有人开放,无需waitlist!阿里通义千问升级1000万字长文档处理功能!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;