Bootstrap

Meta发布开源人工智能模型Llama 3.1

早在今年4月,Meta就透露说,它正在开发人工智能行业的第一款产品:一个性能与OpenAI等公司最好的私有模型相媲美的开源模型。

今天,该大模型已经问世。Meta发布 Llama 3.1,这是有史以来最大的开源人工智能模型。Meta声称,Llama 3.1在几个基准测试上的表现优于gpt-4o和Anthropic的Claude 3.5 Sonnet。

Llama 3.1还在更多国家和语言中提供基于 Llama 的 Meta 人工智能助手,同时增加了一项功能,可以根据某人的特定形象生成图像。首席执行官马克·扎克伯格预测,Meta AI 将在今年年底超过 ChatGPT成为使用最广泛的人工智能助手。

Llama 3.1 比几个月前推出的较小的 Llama 3 模型要复杂得多。最大版本拥有 4050 亿个参数,并使用了超过 16000 个英伟达极其昂贵的 H100 GPU 进行训练。Meta 没有透露开发 Llama 3.1 的成本,但仅根据英伟达芯片的成本计算,保守估计也有数亿美元。

那么,考虑到成本,为什么 Meta 继续以只需拥有数亿用户的公司批准的许可证免费提供 Llama 呢?在 Meta 公司博客上发表的一封信中,扎克伯格认为,开源人工智能模型将超越——并且已经比——专有模型改进得更快,类似于 Linux 如何成为为当今大多数手机、服务器和小工具提供动力的开源操作系统。

马克·扎克伯格将 Meta 在开源人工智能方面的投资与早期的开放计算项目进行了比较,他说,在建立自身能力时,让像惠普这样的外部公司帮助改进和标准化 Meta 的数据中心设计,为公司节省了数十亿美元。展望未来,他预计人工智能也会出现同样的动态,写道:“我相信 Llama 3.1 的发布将是行业的一个转折点,大多数开发者开始主要使用开源。”

为了帮助 Llama 3.1 走向世界,Meta 正在与包括微软、亚马逊、谷歌、英伟达和 Databricks 在内的二十多家公司合作,帮助开发者部署自己的版本。Meta 声称,Llama 3.1的生产成本大约是OpenAI gpt - 4o的一半。Meta正在发布模型权重,以便公司可以在自定义数据上对其进行训练,并根据自己的喜好进行调整。

不出所料,Meta并没有透露太多用于训练Llama 3.1的数据。据人工智能行业公司的工作人员表示,Meta不披露这些信息是因为这是商业机密,而批评人士则表示,这是一种策略,旨在拖延不可避免的版权诉讼冲击。

Meta透露,它使用了合成数据,即由模型而非人类生成的数据,让拥有 4050 亿参数的 Llama 3.1 版本改进了较小的 700 亿和 80 亿版本。Meta 生成式人工智能副总裁Ahmad Al-Dahle预测,Llama 3.1 作为用于培训随后部署的较小模型的老师将受到开发者的欢迎,以更具成本效益的方式。

当询问 Meta 是否同意行业中关于模型的优质训练数据即将耗尽这一日益增长的共识时,Ahmad Al-Dahle表示即将达到上限,尽管可能比一些人认为的要晚。他说:“我们绝对认为我们还有几次(训练)运行,但很难说。”

这是 Meta 首次对 Llama 3.1 的红队测试(或对抗性测试)包括寻找潜在的网络安全和生化用例。更严格测试该模型的另一个原因是 Meta 所描述的新兴智能行为。

例如,Ahmad Al-Dahle,Llama 3.1 能够与搜索引擎 API 集成,“根据复杂的查询从互联网检索信息,并连续调用多个工具以完成您的任务”。他给出的另一个例子是要求模型绘制过去五年美国售出房屋的数量。它可以为您检索(网络)搜索并生成 Python 代码并执行它。

Meta自己对Llama的实现是它的人工智能助手,它被定位为像ChatGPT一样的通用聊天机器人,可以在 Instagram、Facebook 和 WhatsApp 的几乎每个部分找到。从本周开始,Llama 3.1 将首先通过美国的 WhatsApp 和 Meta AI 网站访问,随后几周内将在 Instagram 和 Facebook 上推出。它正在更新以支持新语言,包括法语、德语、印地语、意大利语和西班牙语。

虽然 Llama 3.1 最先进的 4050 亿参数模型在 Meta AI 中可免费使用,但在给定的一周内超过未指定数量的提示后,助手将切换到规模较小的 700 亿模型。这表明 4050 亿模型对于 Meta 来说全面运行成本过高。发言人Jon Carvill表示,公司将在评估早期使用情况后提供有关提示阈值的更多信息。

Meta AI 中的新Imagine Me功能通过您手机的摄像头扫描您的面部,然后让您将自己的形象插入其生成的图像中。通过这种方式捕捉您的形象,而不是通过您个人资料中的照片,Meta 有望避免创建深度伪造机器。该公司看到了人们对创建更多种类的人工智能媒体并分享到其动态的需求,即使这意味着模糊真实与不真实之间的界限。

Meta AI 也将在未来几周内登陆 Quest 头戴设备,取代其语音命令界面。就像它在 Meta Ray-Ban 眼镜中的实现一样,当您处于头戴设备的直通模式(通过显示屏显示现实世界)时,您将能够在 Quest 上使用 Meta AI 来识别和了解您正在查看的内容。

除了马克·扎克伯格预测 Meta AI 将在今年年底成为使用最广泛的聊天机器人(ChatGPT拥有超过1亿用户)之外,Meta 尚未分享其助手的任何使用数据。“我认为整个行业在实现产品与市场匹配的道路上仍处于早期阶段,”Ahmad Al-Dahle说。尽管人工智能已经感觉有些过度炒作,但很明显,Meta 和其他参与者认为这场竞赛才刚刚开始。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

;