人工智能投资已达到新高,重点是生成式人工智能,但在大多数情况下,该技术尚未实现预期的商业价值。这项研究通过分析各种人工智能创新(其中许多创新正在快速发展),帮助人工智能领导者确定其他值得投资的技术。
需要知道的
生成式人工智能 (GenAI) 已经度过了预期膨胀的高峰期,尽管对其的炒作仍在继续。到 2024 年,基于其他人工智能技术的项目将产生更多价值,无论是独立的还是与 GenAI 结合的,这些项目都有标准化的流程来帮助实施。为了实现最大收益,人工智能领导者应该将未来的系统架构建立在复合人工智能技术的基础上,结合技术成熟度曲线各个阶段的创新方法。
随着人工智能项目的数量和规模不断增加,二阶效应开始发挥作用。因此,人们越来越关注治理、风险、所有权、安全和减轻技术债务。这些因素正在国家、企业、团队和个人从业者层面得到解决,但即使法规已达到高级阶段,也远未成熟。
炒作周期
今年炒作周期中最大的两个推动因素是人工智能工程和知识图谱,它们凸显了以稳健的方式处理大规模人工智能模型的必要性。人工智能工程是大规模交付企业人工智能解决方案的基本要求,而企业人工智能解决方案需要新的团队拓扑结构。知识图谱提供了可靠的逻辑和可解释的推理,而GenAI 使用的深度学习技术虽然有缺陷,但预测能力强大。
创新触发器中的创新包括复合人工智能、人工智能就绪数据、因果人工智能、决策智能、人工智能模拟和多智能体系统。这些反映了对流程和决策自动化从单一模型输出向协调多轮复合服务发展的需求日益增长。
在期望膨胀的顶峰时期,负责任的人工智能、人工智能 TRiSM、及时工程和自主人工智能表明,人们越来越担心企业和个人迅速扩大人工智能使用的治理和安全方面。
即将走出巅峰或已经进入衰退低谷的是合成数据、ModelOps、边缘 AI、神经形态计算和智能机器人。这些创新仍然势头强劲,但实施水平各不相同,而且经常被误用或受到商业价值预期过高的影响。神经形态计算和智能机器人在过去一年中取得了长足进步,表明它们有可能在技术成熟度曲线的其余部分快速发展。
由于市场上出现了大量基于 GenAI 的云 AI服务,自去年以来,云 AI 服务在技术成熟度曲线上有所退步。这些服务的供应商和最终用户在服务容量、可靠性、模型更新频率和成本波动方面遇到了问题,但这可能被视为成长的烦恼。
处于启蒙阶段的人工智能技术已经经历了多年的创新,并且越来越接近主流应用。尽管某些领域存在严重质疑、实施限制并撤销了一些运营许可证,但在某些地方,自动驾驶汽车的使用有所增加。现在由 GenAI 提供支持的智能应用程序已进入劳动力市场,但需要更多时间来客观量化它们对生产力的影响。
随着企业和政府开始对人工智能主导的未来所带来的潜力和危险做出反应,今年技术成熟度曲线上出现了量子人工智能、具身人工智能和主权人工智能等新面孔。
图 1:2024 年人工智能技术成熟度曲线
优先级矩阵
与许多其他技术成熟度曲线相比,该技术成熟度曲线的不同寻常之处在于,它拥有如此多的变革性或高效益的创新,却没有中等效益的创新,只有一项低效益的创新。
Gartner 预计,两年内,复合 AI 将成为开发 AI 系统的标准方法,并得到广泛采用。另一项变革性创新——计算机视觉,已通过智能设备成为大众消费者采用的对象。
值得特别关注的创新包括决策智能、具身人工智能、基础模型、GenAI、智能应用和负责任人工智能,距离主流应用还有两到五年的时间。尽早采用这些创新将带来显著的竞争优势,并缓解在业务流程中使用人工智能模型所带来的问题。
在距离主流应用还有 5 到 10 年时间的创新中,神经形态计算可能为新型人工智能架构打开大门。新想法和创业企业的涌入对于这项技术的进一步发展至关重要。
人工智能领导者应该在对具有潜在变革性或高度有益的创新的战略探索与对不需要大量工程或数据科学知识且已被商品化为独立应用程序和打包业务解决方案的组件的创新的研究之间取得平衡。
表1 :2024 年人工智能优先级矩阵
影响力 | 距离主流采用的时间 | |||
不到 2 年 | 2-5年 | 5 - 10 年 | 超过 10 年 | |
颠覆 | ||||
较高 | 提示工程 | 模型运营 | ||
中等 | ||||
偏低 |
来源:Gartner(2024 年 6 月)
脱离炒作周期
以下创新已从今年的炒作周期中剔除:
-
运营型人工智能系统:被人工智能工程所取代。
-
数据标记和注释:被删除,因为它与2024 年数据科学和机器学习的炒作周期更相关。
-
人工智能制造商和教学套件:因缺乏炒作而被放弃。
技术萌芽期
1、自主系统
影响力评级:颠覆
市场渗透率:不到目标受众的 1%
成熟度:新兴
定义:自主系统是自我管理的物理或软件系统,执行领域有限的任务,表现出三个基本特征:自主性(无需外部协助即可自主执行自己的决策和任务);学习性(根据经验、不断变化的条件或目标改变其行为和内部操作);和代理(了解自己的内部状态和目的,指导其学习方式和内容,并使其能够独立行动)。
为什么重要
自主系统正成为一种重要趋势,因为它们能够实现传统 AI 技术无法实现的业务适应性、灵活性和敏捷性。在运营环境不可预测且实时监控和控制不切实际的情况下,它们的灵活性很有价值。在即使没有很好理解的算法(复合 AI)来实现某项任务的情况下,它们的学习能力也很有价值。
商业冲击
自主系统的优势在于:
-
应用复合人工智能技术的传统自动化是不够的,或者使用固定的训练数据不切实际或不够灵活。
-
提供实时人工指导是不切实际的,或者无法预测训练条件。
-
我们无法编写精确的学习算法,但任务是可以不断学习的。
-
持续或快速变化的任务或环境使得机器学习系统的频繁重新训练和测试变得太慢或成本太高。
驱动因素
自主系统是三部分趋势的顶峰:
-
自动化系统是一个非常成熟的概念。它们执行明确定义的任务,并具有固定的确定性行为(例如装配机器人焊接汽车)。使用人工智能技术实现自动化的用例越来越多,为自主系统奠定了坚实的基础。
-
自主系统超越了简单的自动化,增加了独立行为。它们可能表现出一定程度的自适应行为,但主要受算法控制(例如自动驾驶汽车或波士顿动力公司的 Spot机器人,其总体路线和目标由远程人类操作员设定,但具有相当大的局部自主性——即针对非常具体的任务)。自适应人工智能能力是自主系统的必要基础,应该会加速自主系统的采用。
-
自主系统通过学习和自我修改算法表现出自适应行为。例如,爱立信展示了如何使用强化学习和数字孪生来创建一个自主系统,该系统可以在创建优化规则的同时动态优化 5G 网络性能。这一趋势表明了此类系统的可行性。早期了解精心界定的自主系统将建立对其独立运行能力的信任。
其他驱动因素包括:
-
自主行为是一个范围。例如,聊天机器人从互联网讨论中学习;流媒体服务了解你喜欢哪些内容;送货机器人分享有关路径和障碍物的信息以优化车队路线。能够学习和调整其行为的系统的优势将是引人注目的。
-
由于现有应用程序的日益复杂以及大型动作模型的出现,基于代理的系统正在经历采用的复兴。
-
目前,关于自主神经学的大量学术研究正在进行中,这将导致其得到更广泛的应用。
障碍
-
不确定性:不断学习和调整行为的系统是不可预测的。这将给员工和客户带来挑战(例如法律问题),因为他们可能不理解系统如何以及为何如此运行。
-
不成熟:在自主学习成为主流之前,该领域的技能将缺乏。可能需要新型专业服务(如自主商业技能)。
-
社会问题:当系统与人互动时,不当行为、不确定性或缺乏理解可能会引起公众的抵制。
-
数字道德和安全:自主系统需要架构和护栏,以防止它们在无人验证系统的情况下学习不良、危险、不道德甚至非法的行为。
-
法律责任:自主系统的供应商可能很难对其行为承担全部责任,因为这取决于其设定的目标、运行条件和所学到的知识。
用户建议
-
首先积累自主系统使用经验,了解组织所受的限制和要求(法律、技术和文化)。在早期采用自主技术将为软件或物理系统带来灵活性和性能优势的情况下,先试行自主技术。
-
通过分析部署自主系统的业务、法律和道德后果(部分是不确定的)来管理自主系统部署中的风险。通过创建一个多学科工作组来实现这一点。
-
通过在复杂且快速变化的环境等情况下试行自主技术来优化其优势,早期采用将在软件或物理系统中带来灵活性和性能优势。
供应商:Adapdix ;IBM;Latent AI;Playtika;Vanti
2、量子人工智能
影响力评级:较低
市场渗透率:不到目标受众的 1%
成熟度:萌芽阶段
定义:量子人工智能是量子技术与人工智能交叉领域中新兴的研究领域。量子人工智能旨在利用量子力学的独特性质来开发新的、更强大的人工智能算法,这些算法的性能优于经典算法,有可能产生专为在量子系统上运行而设计的新型人工智能算法。
为什么重要
量子人工智能是一个活跃的研究领域。一旦实现商业化,量子人工智能可能会在以下方面提供帮助:
-
使组织能够使用量子系统更快地解决高级 AI 分析问题,同时仅使用传统 AI 超级计算资源的一小部分资源。
-
开发利用量子力学的新型人工智能算法,提供超越传统系统所能执行的功能。
-
解锁包括药物研发、能源产业和物流在内的颠覆性应用。
商业冲击
尽管目前尚处于萌芽阶段的量子人工智能领域对商业的影响较小,但当经过验证的技术成熟时,量子人工智能将在各个行业中带来竞争优势;例如:
-
生命科学:通过缩短时间、降低成本和改善结果来改变药物发现。
-
财务:优化投资组合,降低风险并改进欺诈检测系统。
-
材料科学:发现彻底改变能源运输和制造业并创造新收入来源的新材料。
驱动因素
-
量子技术的炒作正促使越来越多的企业和研究人员探索量子和人工智能的交叉点。
-
量子系统创新步伐的加快(包括更大量程、更高质量的量子比特,以及量子系统更高的稳定性和可靠性)正推动人们对包括量子人工智能在内的各个领域应用的更大兴趣。
-
量子计算作为一种服务正在降低进入门槛,鼓励研究人员之间的更大合作,并推动新算法和技术的探索。
-
全球各国政府和企业正在增加对量子(和量子人工智能)研究的资助,从而加速创新。
-
生成式人工智能的炒作日益增多,其光环效应促使人们重新关注包括量子人工智能在内的替代研究技术,这些技术可能会带来新的颠覆性成果。
-
大学和培训项目正在制定计划和课程,以培养具备量子能力的劳动力。
障碍
-
硬件限制:当前的量子系统虽然越来越稳定,但仍然容易出错且存在固有噪声,限制了它们的效用和对实用量子人工智能的影响。
-
算法限制:虽然已经提出了几种量子人工智能算法,但很少有算法经过审查和验证,而且它们还远远没有达到企业级应用的水平。
-
成本:尽管实用性有限且可广泛使用,但快速发展的噪声中型量子(NISQ)系统相对昂贵,这可能会阻碍设计量子AI 算法所需的研究和开发工作。
-
系统的可扩展性:将量子系统扩展到企业级量子人工智能所需的水平仍然是一个主要的技术障碍。
-
计算范式:将传统数据和分析管道与量子相结合本质上具有挑战性,因为量子系统从数据表示角度和计算(非冯诺依曼模型)角度都采用根本不同的范式运行。
用户建议
-
优先投资人工智能和GenAI ,而不是量子人工智能。量子人工智能还处于萌芽阶段,不值得重点投资,而且不太可能在未来两到三年内产生实质性收益。
-
通过赞助学术研究与当地大学合作,以降低量子人工智能投资的风险,并建立大学到产业的人才管道。
-
创建一个量子人工智能机会雷达,使您能够跟踪底层技术和量子人工智能算法的进展,使您能够在量子技术萌芽领域的发展过程中最大化价值创造。
供应商:亚马逊;谷歌;IBM;IonQ;多元计算;Pasqal ;SandboxAQ;Zapata AI
3、第一性原则人工智能
影响力评级:颠覆
市场渗透率:目标受众的 5% 至 20%
成熟度:新兴
定义:第一性原则人工智能(FPAI;又称物理信息型人工智能)将物理和模拟原理、控制定律和领域知识融入人工智能模型。相比之下,纯“数字”人工智能模型不一定遵循物理系统和第一性原则的基本控制定律,也不能很好地推广到未经训练的场景。FPAI 将人工智能工程扩展到复杂系统工程和基于模型的系统(如基于代理的系统)。
为什么重要
随着人工智能在工程和科学用例中的扩展,它需要更强大的建模问题和更好地表示其背景的能力。纯数字人工智能解决方案无法在训练之外很好地概括,从而限制了它们的适应性。FPAI灌输了对背景和物理现实的更可靠的表示,从而产生了更具适应性的系统。这可以缩短训练时间,提高数据效率,提高泛化能力和提高物理一致性。
商业冲击
物理上一致且科学上合理的 AI 模型可以显著提高适用性,尤其是在工程用例中。FPAI 有助于用更少的数据点训练模型并加速训练过程,帮助模型更快地收敛到最优解。它提高了模型的通用性,可以对未知场景做出可靠的预测,包括对非平稳系统的适用性,并增强了透明度和可解释性,从而提高了可信度。
驱动因素
-
FPAI方法可以更灵活地表示系统运行的环境和条件,从而使开发人员能够构建更具适应性的系统。传统的业务建模方法一直很脆弱。这是因为构成解决方案的数字构建块无法在其初始训练数据之外很好地概括,因此限制了这些解决方案的适应性。
-
FPAI 方法提供额外的物理知识表示,例如偏微分方程来指导或约束 AI 模型。传统AI 技术,尤其是机器学习领域的技术,一直面临着严重的限制——尤其是在因果关系和依赖性分析、可接受值、上下文灵活性和记忆保留机制方面。以资产为中心的行业已经开始利用FPAI进行物理原型设计、预测性维护或复合材料分析,并结合增强现实实现。
-
气候模型、大规模数字孪生和复杂的健康科学问题等复杂系统建模尤其具有挑战性。复合人工智能方法为这些问题提供了更具体的答案和可管理的解决方案,但它们的工程设计仍然是一项重大挑战。FPAI为这些问题提供了更直接的答案。
-
第一性原则知识通过定义问题和解决方案的边界来简化和丰富人工智能方法,从而缩小了机器学习所采用的传统蛮力方法的范围;例如,已知的物理对象轨迹简化了人工智能支持的天空监测。基于第一性原则的语义揭示了深度伪造。
-
对更强大、适应性更强的业务模拟系统的需求也将推动 FPAI 方法的采用。有了更好的上下文建模范围和更准确的知识表示技术,模拟将更加可靠,并能解释更广泛的可能场景——所有这些都更好地立足于现实。
障碍
-
在基准数据集和问题中对这些模型进行系统测试和标准化评估的开发可能会减缓FPAI功能的采用。
-
从计算角度来看,以有效的方式在大型数据集上扩展复杂FPAI模型的训练、测试和部署将是一个问题。
-
从资源角度来看,许多不同社区(物理学家、数学家、计算机科学家、统计学家、人工智能专家和领域科学家)之间的合作将是一个挑战。
-
蛮力方法在人工智能中很普遍,并且对于数据科学家来说很容易实现,而第一性原则则需要某个主题的额外基础知识,因此需要一个多学科团队。
用户建议
-
通过识别无法减少的错误和无法解决的差异(包括数据质量)来设定现实的发展目标。
-
鼓励从小范围的问题开始建立可重复、可验证的模型;复杂系统(从科学意义上讲)通常是这种方法的良好候选者。
-
执行相关领域物理学和基于第一性原则的模型的准确性和物理一致性测试标准,同时描述不确定性的来源。
-
推动FPAI模型的模型一致性训练,并利用噪声、稀疏性和不完整性等代表应用的数据特征来训练模型。
-
量化普遍性,即性能如何随着对未知的初始和边界条件和场景的推断程度而下降。
-
确保多学科人工智能团队(具有领域专业知识)中的相关角色和教育,以便团队能够开发出有效且可验证的解决方案。
供应商:Abzu;IntelliSense.io;MathWorks;NNAISENSE ;NVIDIA ;VERSES
4、具身人工智能
影响力评级:颠覆
市场渗透率:不到目标受众的 1%
成熟度:萌芽阶段
定义:具身人工智能基于这样的观点:在特定情境下,智能与具身化密不可分,一个塑造另一个。在这种方法中,物理或虚拟人工智能代理的模型经过训练,并与其用户界面、传感器、外观、执行器或与特定、真实或模拟环境交互所需的其他功能共同设计。这可以实现智能任务的稳健、可靠和自适应执行。
为什么重要
具身人工智能旨在创建能够自主行动或在实际动态环境中增强人类能力的人工智能代理,其远超当前的人工智能,包括决策和行动可靠性和有效性有限的抽象大型语言模型。这是通过主动感知和自适应行为实现的,由人工智能代理的智能进行协调,并与特定环境中的人工智能代理宿主或身体的能力和约束共生。
商业冲击
具身人工智能将进一步在各种用例中创造价值。特别是在需要更多实用技术、更好地表现其环境的物理、社会或其他特征以及更强的应对意外或破坏性事件的弹性的情况下。示例用例包括虚拟助手、头像、游戏角色、自动驾驶汽车和智能机器人。这将为更有效、更值得信赖的人工智能以及更具变革性的人工智能应用铺平道路,以实现新产品、服务和商业模式。
驱动因素
-
生成式人工智能(GenAI)的出现促进了人工智能的普遍应用。然而,它也凸显了当前人工智能的局限性,特别是在可靠性方面,以及人工智能在现实中情境化和落地方面的挑战。
-
具身人工智能受益于计算能力和 GenAI 的进步,可通过强化学习支持逼真的模拟,从而进行自适应行为训练。这还支持共同进化人工智能代理具身化和智能的基线版本的方法,然后再进一步改进它们并将其部署到现实世界中。
-
具身人工智能是通过新兴方法实现的,例如物理信息或第一性原则人工智能(代表物理定律或工程启发式方法等)、复合人工智能(例如,使用神经符号人工智能进行时空推理)和因果人工智能(代表因果关系)。
-
虚拟/增强/混合现实、游戏、智能机器人、自主系统、自然语言生成和情感 AI 等领域的创新进一步激发了人们对具身 AI 的兴趣。所有这些都与 AI 代理(包括物理和虚拟)的改进设计有关。物理代理还受益于传感器技术、机器人工程以及用于更自然的力学和触觉界面的新材料等的进步。
-
具身人工智能的进步得益于关于智能的科学见解的不断发展,智能不再被视为一个集中式的大脑概念。感知、情感、推理和行为等认知特征实际上是分布在身体的多个部位并共同进化的。这也与分布式人工智能系统架构(包括多智能体系统)非常契合。
-
具身人工智能被视为迈向未来通用人工智能的关键一步,因为它与与其环境交互的运行实体密不可分。这意味着它不是抽象出来的,而是在设计上扎根于现实,有望为其知识表示和“原生”常识提供内在含义或语义。
障碍
-
世界非常复杂、难以预测,甚至混乱。因此,逼真的模拟、有效的机器人技术以及真正的自动驾驶汽车等的开发一直难以实现。
-
现实世界的互动需要实时、高响应度的人工智能,即使能源和计算资源有限(例如在移动或边缘设备上)。然而,更轻量级和更节能的人工智能并不容易实现。
-
具身人工智能有望实现更强大、更自主的人工智能。不幸的是,这不仅可能促进善意使用,也可能促进恶意使用。然而,负责任的人工智能的有效监管和风险管理并非必然。
-
人工智能的设计可能不必要地拟人化(一个身体有两条腿和两只胳膊),从而带来额外的复杂性和挑战。
-
具象人工智能需要机器学习、图形设计、机械工程等不同领域的专家进行多学科合作,具体取决于人工智能代理的用例和类型。
用户建议
-
确定可能从应用具身人工智能中受益的用例,包括更多虚拟领域(例如在线客户互动或知识工作者增强)和更多物理领域(例如制造或物流)。
-
探索具身化人工智能可以带来的价值,即通过减少当前人工智能的局限性来更好地解释仓库中的物理限制或客户互动中的文化规范等。这可能会分别提高人工智能使用的安全性或减少偏见。
-
拓展人工智能代理的开发或训练方式。从单纯的建模方法转向考虑智能如何成为人工智能模型与代理具体化设计之间的协同作用。例如,这可能与虚拟代理的面部表情或物理代理的运动协调有关。
供应商:Amazon; Figure; Google; Hanson Robotics; Intel; Intrinsic; NNAISENSE; Qualcomm; Tesla
5、多智能体系统
影响力评级:较高
市场渗透率:不到目标受众的 1%
成熟度:萌芽
定义:多智能体系统 (MAS) 是一种由多个独立(但可交互)智能体组成的 AI 系统,每个智能体都能够感知其环境并采取行动。智能体可以是 AI 模型、软件程序、机器人和其他计算实体。多个智能体可以共同努力实现超越单个智能体能力的共同目标,并具有更高的适应性和稳健性。
为什么重要
当前的人工智能专注于为特定用例构建单个代理,将人工智能的潜在商业价值限制在可以通过单个整体模型解决的简单问题上。多个自主代理的组合应用可以解决单个代理无法解决的复杂任务,同时创建更具适应性、可扩展性和稳健性的解决方案。它也能够在需要分散决策的环境中取得成功。
商业冲击
多智能体系统可用于:
-
生成式人工智能:协调人工智能代理以完成复杂任务
-
机器人技术:用于仓库优化、搜索救援、环境监测和其他用例的机器人和无人机群
-
能源和公用事业:智能电网优化和负载平衡
-
供应链:优化调度、计划、路线和供应链优化
-
电信:网络优化和故障检测
-
医疗保健:使用代理来模拟参与者(个人、家庭、专业人士)
驱动因素
-
生成式 AI代理:大语言模型 (LLM) 越来越多地被赋予了额外的功能,例如内部存储器和外部应用程序插件,以实现 AI 代理。一种新兴的设计模式是将这些基于 LLM 的 AI 代理组装并组合成更强大的系统,这增加了多代理系统的可行性和兴趣。
-
决策复杂性增加:人工智能越来越多地应用于包含复杂系统的现实世界工程问题,其中相互作用的部件组成的大型网络表现出难以预测的突发行为。多智能体系统的分散性使其更具弹性,更能适应复杂的决策。
-
模拟和多智能体强化学习:模拟引擎的真实性和性能的进步,以及新的多智能体强化学习技术的使用,使得可以在模拟环境中训练多智能体人工智能系统,然后将其部署到现实世界中。
障碍
-
训练复杂性:多智能体系统通常比单个 AI 智能体更难训练和构建。这些系统可能会表现出难以预测的突发行为,这增加了对稳健训练和测试的需求。
-
监控和管理多个代理:代理之间的协调和协作具有挑战性。需要仔细监控、管理和共同基础,以确保组合的多代理系统行为实现其预期目标。
-
采用和准备程度有限:尽管多智能体系统有诸多好处,但它在实际问题中的应用尚未普及,这导致企业缺乏意识和实施准备。
-
所需的专业技能:构建和部署多智能体系统需要超越传统人工智能技能的专业技能,特别是使用强化学习和模拟。
-
分散的供应商格局:分散的供应商格局会阻碍客户的采用和参与。
用户建议
-
使用多智能体系统来解决需要分散决策且无法由单个 AI 智能体解决的复杂问题。这包括智能体需要适应不断变化的环境的问题,以及需要将具有不同专业知识的多种智能体组合在一起以实现目标的问题。
-
逐步转向多代理方法,因为这是一个新兴的研究领域,其风险和好处尚未完全了解。
-
在实施多智能体系统时建立明确的护栏,包括有关自主性、责任、强大的安全措施和数据隐私协议的法律和道德准则。
-
投资使用模拟技术进行人工智能训练,因为模拟是构建和测试多智能体系统的主要环境。
-
对AI 团队进行多智能体系统方面的培训,了解它们与单智能体 AI 设计的区别,以及一些可用于训练和构建这些系统的技术。
供应商:Alphabet;Ansys;The AnyLogic Company;Cosmo Tech;FLAME GPU;MathWorks ;微软;OpenAI
6、人工智能模拟
影响力评级:较高
市场渗透率:目标受众的 1% 至 5%
成熟度:新兴
定义:人工智能模拟是人工智能和模拟技术的综合应用,共同开发人工智能代理以及可以对其进行训练、测试和部署的模拟环境。它既包括使用人工智能使模拟更加高效和有用,也包括使用各种模拟模型来开发更通用和更具适应性的人工智能系统。
为什么重要
决策复杂性的增加推动了对人工智能和模拟的需求。然而,当前的人工智能面临挑战,因为它很难改变,而且通常需要大量数据。相反,现实模拟的构建和运行成本高昂且困难重重。为了解决这些挑战,一种日益流行的方法是将人工智能和模拟结合起来:模拟用于使人工智能更加稳健并弥补训练数据的不足,人工智能用于使模拟更加高效和逼真。
商业冲击
AI模拟可以带来:
-
通过将人工智能的应用扩展到数据稀缺的情况来增加价值,使用模拟来生成合成数据(例如,生成人工智能的合成数据)
-
利用人工智能减少创建和使用复杂逼真的模拟的时间和成本,从而提高效率
-
通过使用模拟生成不同的场景,提高人工智能在不确定环境中的性能,从而提高稳健性
-
通过重复使用模拟环境来训练未来的人工智能模型,减少技术债务
驱动因素
-
人工智能训练数据的有限可用性增加了对模拟等合成数据技术的需求。模拟技术(如基于物理的 3D 模拟)具有独特的优势,可以生成多样化的人工智能训练数据集。随着训练数据变得越来越稀缺,这对于 GenAI 来说变得越来越重要。
-
能力的进步使模拟对人工智能越来越有用。模拟能力一直在快速提高,这得益于计算性能的提高和更高效的技术。
-
决策过程的复杂性不断增加,这也使人们对人工智能模拟的兴趣日益浓厚。模拟能够生成各种“极端情况”场景,这些场景在现实世界的数据中并不常见,但对于训练和测试人工智能以使其在不确定的环境中表现良好仍然至关重要。
-
人工智能技术债务的增加推动了对模拟提供的可重复使用环境的需求。组织将越来越多地部署数百个人工智能模型,这需要将重点转向构建持久、可重复使用的环境,在这些环境中可以训练、定制和验证许多人工智能模型。模拟环境是理想的选择,因为它们可重复使用、可扩展,并且可以同时训练许多人工智能模型。
-
模拟的日益复杂推动了人工智能的使用,使其更加高效。现代模拟是资源密集型的。这推动了人工智能的使用来加速模拟,通常是通过使用可以取代模拟部分内容的人工智能模型,而无需运行资源密集型的、逐步的数值计算。
-
对学习模拟(称为“世界模型”)的研究正在推动人们对人工智能模拟的兴趣:越来越多的研究开始关注训练世界模型,这些模型可以根据环境的当前状态和代理的行为来预测环境将如何演变。这些学习模拟可以使人工智能模拟更加可行,因为无需直接指定模拟参数。
障碍
-
模拟与现实之间的差距:模拟只能模拟(而非完全复制)真实世界系统。随着模拟能力的提高,这种差距将会缩小,但它仍将是一个关键因素。鉴于这种差距,在模拟中训练的 AI 模型在部署后可能不会具有相同的性能;模拟训练数据集和真实世界数据的差异可能会影响模型的准确性。
-
人工智能模拟管道的复杂性:人工智能和模拟技术的结合可能会导致更复杂的管道,更难测试、验证、维护和排除故障。
-
采用人工智能模拟的准备程度有限:人工智能从业者对利用模拟能力缺乏认识,这可能会阻碍组织实施人工智能模拟方法。
-
供应商市场分散:人工智能和模拟市场分散,很少有供应商提供组合人工智能模拟解决方案,这可能会减缓这种功能的部署。
用户建议
-
通过提供用于合成数据生成或强化学习的模拟环境,利用模拟技术补充人工智能,以优化商业决策或克服现实世界数据的缺乏。
-
通过应用深度学习来加速模拟,并应用生成式人工智能来增强模拟,从而用人工智能来补充模拟。
-
在 AI 和模拟团队、项目和解决方案之间建立协同效应,从而为日益复杂的用例提供新一代更具适应性的解决方案。逐步构建更通用和互补的模型的通用基础,这些模型可在不同的用例、业务环境和生态系统中重复使用。
-
优先考虑提供集成不同人工智能技术(复合人工智能)以及模拟的平台的供应商,为人工智能、模拟和其他相关技术(如图形、自然语言处理或地理空间分析)的结合使用做好准备。
供应商:Altair;Ansys;The AnyLogic Company;Cosmo Tech;Epic Games;MathWorks;微软;NVIDIA;罗克韦尔自动化;Unity
7、因果人工智能
影响力评级:较高
市场渗透率:目标受众的 1% 至 5%
成熟度:新兴
定义:因果人工智能识别并利用因果关系,超越基于相关性的预测模型,实现能够更有效地规定行动并更自主地行动的人工智能系统。它包括不同的技术,例如因果图和模拟,有助于发现因果关系以改善决策。
为什么重要
人工智能的最终价值在于做出更好的决策并采取有效的行动。然而,目前基于相关性的方法有其局限性。假设过去和未来不会有太大偏差,这种方法可能适合预测,但预测结果并不等同于了解导致结果的原因以及如何改进结果。当我们需要更稳健地进行预测并更具指导性地确定影响特定结果的最佳行动时,因果人工智能至关重要。
商业冲击
因果人工智能将导致:
-
通过评估干预效果,提高人工智能系统的决策增强和自主性。
-
通过添加领域知识来用较小的数据集引导AI 模型,从而提高效率。
-
通过捕捉易于解释的因果关系来实现更好的可解释性。
-
通过利用在不断变化的环境中仍然有效的因果关系来实现更高的稳健性和适应性。
-
通过较少成本和时间消耗的实验来提取因果知识的能力。
-
通过使因果关系更加明确来减少人工智能系统中的偏见。
驱动因素
-
分析需求正在从预测能力转向更具规范性的能力。做出准确的预测仍是关键,但对如何影响预测结果的因果理解也变得越来越重要。
-
人工智能系统越来越需要自主行动,尤其是在时间敏感且复杂的用例中,在这些用例中,人为干预是不可行的。只有通过人工智能了解行动会产生什么影响以及如何进行有效干预,才能实现这一点。
-
某些用例的数据可用性有限,因此需要更多数据效率更高的技术,例如因果 AI。因果 AI 利用人类对因果关系的领域知识,在小数据情况下引导 AI 模型。
-
业务的复杂性和动态性不断增加,这需要更强大的 AI 技术。过去几年的动荡暴露了各行各业基于相关性的 AI 模型的脆弱性。因果结构的变化比统计相关性慢得多,这使得因果 AI 在快速变化的环境中更加强大且适应性更强。
-
对人工智能更高信任度和可解释性的需求,推动了人们对更直观的模型的兴趣。因果人工智能技术(如因果图)可以明确说明原因,并以人类理解的方式解释模型。
-
生成式人工智能 ( GenAI)可以加速因果人工智能的实施。GenAI正在成为一种辅助手段,用于探索文档和其他数据源以获取现有的因果知识。然后可以使用它来生成候选因果图,虽然这仍然需要人工验证或完成,但可以减少耗时的手动工作。
-
人工智能的下一步需要因果人工智能。当前的深度学习模型,尤其是 GenAI,在可靠性和推理能力方面存在局限性。将 GenAI 与因果人工智能(尤其是因果知识图)相结合的复合人工智能方法为将人工智能提升到更高水平提供了一条有希望的途径。
障碍
-
因果关系并非微不足道。并非每个现象都易于根据其原因和结果进行建模。无论使用哪种人工智能,因果关系都可能是未知的。
-
因果 AI 模型的质量取决于其因果假设以及用于构建该模型的数据。这些数据容易出现偏差和不平衡,并且可能不完整地代表所有已知或未知的因果因素。
-
因果人工智能需要技术和领域专业知识才能正确估计因果关系。构建因果人工智能模型通常比构建基于相关性的预测模型更困难,需要领域专家和人工智能专家之间的积极合作。
-
AI 专家可能不了解因果关系方法。如果 AI 专家过度依赖机器学习 (ML) 等数据驱动模型,组织在寻求实施因果关系 AI 时可能会遇到阻力。
-
供应商格局尚处于起步阶段,企业采用率目前较低。当组织运行初始因果 AI 试点并确定因果 AI 最相关的特定用例时,这代表着一项挑战。
用户建议
-
承认基于相关性的 AI 和 ML 方法的局限性,这些方法侧重于利用相关性,而大多忽略因果关系。这些局限性也适用于大多数 GenAI 技术,包括基础模型和大型语言模型。
-
当需要决策智能中的更多增强和自动化时,即当 AI 不仅需要生成预测,还需要了解如何影响预测结果时,请使用因果 AI 。示例包括客户保留计划、营销活动分配和金融投资组合优化,以及智能机器人和自主系统。
-
根据具体用例的复杂性选择不同的因果 AI 技术。这些包括因果规则、因果图和贝叶斯网络、模拟和用于因果学习的 ML。
-
对数据科学团队进行因果关系 AI培训。解释因果关系 AI 和基于相关性的 AI 之间的区别,并介绍可用于整合因果关系的各种技术。
供应商:Actable AI;causaLens;Causality Link;Geminos Software;IBM;微软;Parabole.ai;Scalnyx ;Vizuro;Xplain Data
8、AI就绪数据
影响力评级:较高
市场渗透率:目标受众的 1% 至 5%
成熟度:萌芽
定义:证明数据适合特定 AI 用例的能力决定了数据是否为 AI 就绪数据。就绪证明来自于通过评估其与用例的一致性、实现数据资格和确保数据治理来持续满足 AI 要求的能力。因此,只能根据用例和所使用的 AI 技术来确定 AI 就绪数据,这迫使人们采用新的数据管理方法。
为什么重要
随着预训练的现成模型的兴起和生成式 AI 的炒作,组织及其数据管理领导者处于为 AI 制定数据策略的前沿,以确保其数据已准备好为 AI 服务并支持数据驱动的应用程序。首席数据和分析官以及数据管理领导者需要能够快速响应 AI 就绪的数据需求。一切都从提供 AI 就绪数据以支持 AI 用例开始。
商业冲击
提供 AI 就绪数据以支持企业 AI 战略的能力对于实现 AI 的商业价值至关重要。因此,所有大规模投资 AI 的组织都需要改进其数据管理实践和能力,不仅要保留经久不衰的经典数据管理理念,还要将其扩展到 AI。迭代提供 AI 就绪数据以满足业务的现有和未来需求、确保信任、保护知识产权(IP) 并减少偏见和幻觉至关重要。
驱动因素
-
模型(尤其是生成式 AI 模型)越来越多地来自供应商,而不是内部交付。数据正成为企业从这些预训练模型中获取价值的主要手段。
-
最常见的 AI 解决方案取决于数据可用性、质量和理解,而不仅仅是 AI 模型构建。许多企业试图解决 AI 问题,而没有考虑 AI 特定的数据管理问题。数据管理在 AI 中的重要性经常被低估,因此数据管理解决方案现在必须根据 AI 需求进行调整。
-
传统数据管理方式即将被颠覆,以支持人工智能的发展。人工智能的快速发展为组织和管理人工智能数据带来了新的挑战。我们预计,增强数据管理技术将迎来一个周期,这些技术将更适合满足人工智能的数据需求。基于数据结构的数据生态系统标志着这一新周期的开始。
-
数据管理能力、实践和工具极大地促进了 AI 的开发和部署。AI 社区发明了新的以数据为中心的方法,例如联合机器学习 (ML) 和检索增强生成 (RAG),这些方法受益于数据结构和 Lakehouse 等数据管理创新。例如,将知识图谱作为数据结构的一部分实现,可以让大型语言模型主导的查询受益于图谱提供的上下文,从而提高生成代码的准确性。
-
新的数据管理解决方案可减轻人工智能在数据解释、标记和记录在数据中的人类行为方面放大的偏见。偏见缓解和幻觉是一个严重的人工智能特有问题,迫使数据管理部门确定如何构建、分析和准备数据。
-
生成式人工智能正在消除结构化数据和非结构化数据之间的区别,从而要求数据管理适应这些新用途。
障碍
-
人工智能与数据管理脱节。人工智能社区仍然大多不了解可以极大地促进人工智能开发和部署的数据管理能力、实践和工具,这可能导致在生产中扩展原型时遇到挑战。传统数据管理还忽略了人工智能特定的考虑因素,例如数据偏差、标签和漂移;这种情况正在改变,但进展缓慢。
-
尽管人工智能的数据方面至关重要,但它却被低估了。它包括准备数据集和清晰理解为什么以某种方式收集数据、数据意味着什么以及数据中存在哪些偏见等任务。
-
负责任的 AI 需要对数据和 AI 模型采用新的治理方法。这些是特定于 AI 的数据实践,许多企业希望通过工具而不是治理来解决。
-
模型开发完成后,数据管理活动并不会结束。部署考虑和持续的漂移监控需要专门的数据管理活动和实践。
用户建议
-
将 AI 就绪数据正式化作为数据管理策略的一部分。实施主动元数据管理、数据可观察性和数据结构作为此策略的基础组成部分。结合基础功能和新功能来满足 AI 需求。建立角色和职责来管理支持 AI 的数据。
-
由于人工智能模型依赖于代表性数据,因此以数据为中心进行人工智能模型开发。多样化数据、模型和人员以确保人工智能的价值和道德。
-
利用数据管理专业知识、AI 工程、DataOps 和 MLOps 方法来支持 AI 生命周期。部署模型时包括数据管理要求。制定数据监控和数据治理指标,以确保 AI 模型持续产生正确的输出。
-
执行 AI 数据适用性政策。尽早为每个用例定义和衡量 AI 数据就绪性的最低数据标准,并在扩大 AI 规模时不断证明数据适用性。这些措施包括检查血统、质量和治理评估、版本控制和自动化测试。
-
研究那些具有丰富增强数据管理功能并能与已创建颠覆性数据中心 AI 功能的 AI 工具(如联合 ML 和 RAG)很好地集成的数据管理工具。
供应商:Databricks;Explorium;谷歌;illumex ;Landing AI;LatticeFlow;微软;MOSTLY AI;Protopia AI;YData
9、决策智能
影响力评级:颠覆
市场渗透率:目标受众的 5% 至 20%
成熟度:新兴
定义:决策智能 (DI) 是一门实用学科,通过明确理解和设计决策方式以及如何通过反馈评估、管理和改进结果来促进决策。
为什么重要
当前围绕自动化决策和增强智能的炒作,在决策中的人工智能技术(包括生成式人工智能 [GenAI])的推动下,正将 DI 推向膨胀预期的顶峰。最近的危机揭示了业务流程的脆弱性。将这些流程重新设计为具有弹性、适应性和灵活性将需要方法和技术的规范。快速崛起的决策智能平台 (DIP)市场开始为决策者提供弹性解决方案。
商业冲击
-
DI通过使决策明确透明,提供更好、更及时和更优化的决策。它通过捕捉业务背景来降低决策结果的不可预测性。
-
DI 减少了技术债务并提高了可见性。它通过基于相关性和透明度的质量显著增强决策模型的一致性来提高业务流程的影响力,从而使决策透明且可审计。
驱动因素
-
业务环境复杂多变,业务节奏越来越难以预测和不确定:两股力量正在围绕DIP创造一个新的市场。首先是规则、知识图谱和机器学习 (ML) 等人工智能技术的结合。其次是围绕复合人工智能、智能业务流程、实时事件处理、洞察引擎、决策管理和高级个性化平台的技术集群的融合。
-
需要减少孤立和脱节的非结构化、临时决策:此类决策通常缺乏协调,以牺牲整体效率为代价来促进局部优化。
-
扩大人机协同:这种协同,加上对技术的缺乏信任,正日益取代任务,并从人类的角度引发不安。DI 实践促进了决策模型的透明度、可解释性、公平性、可靠性和可问责性,这对于采用业务差异化技术至关重要。
-
更严格的法规使风险管理更加普遍:从隐私和道德准则到新法律和政府规定,组织在理解其决策的风险影响方面面临困难。DI 促进了明确的决策模型,从而降低了风险。
-
整个组织决策一致性的不确定性:缺乏明确的决策表达,阻碍了集体决策结果的适当协调;DI 解决了这个问题。
-
以 DIP 形式出现的软件工具:DIP 将使组织能够实际实施 DI 项目和策略。
-
GenAI 及其与现有 DI 技术和实践的协同作用:GenAI 的出现为决策提供了更高效、更丰富的背景。它加速了复合 AI 模型的研究和采用,而复合 AI 模型是 DIP 的基础。
障碍
-
业务部门之间缺乏适当的协调:无法公正地重新考虑部门内部和部门间的关键决策流程,从而降低了早期 DI 工作的有效性。
-
碎片化:决策孤岛造成了难以协调的数据、能力和技术集群,并可能减慢决策模型的实施速度。
-
低于标准的运营结构:围绕先进技术的组织结构不充分,例如缺乏人工智能卓越中心,可能会损害 DI 的进展。
-
缺乏更广泛背景下的建模:在几乎只关注技术技能的组织中,人类决策的其他关键部分——心理、社会、经济和组织因素——都没有得到解决。
-
缺乏 AI 素养:许多组织仍然缺乏对 AI 技术的了解。这种 AI 素养可能会减缓 DI 项目的发展。
用户建议
-
通过使用原则构建模型来增强可追溯性、可复制性、针对性和可信度,促进跨组织决策的弹性和可持续性。
-
通过模拟决策代理的集体行为并估计其整体贡献与局部优化来提高决策代理的可预测性和一致性。
-
培养员工在传统和新兴决策增强和决策自动化技术方面的专业知识,包括预测和规范(优化和业务规则)分析。提高业务分析师的技能,并培养决策工程师和决策管家等新角色。
-
通过与专业专家、人工智能专家和业务流程分析师合作,根据每个决策情况的特定要求定制决策技术的选择。
-
通过鼓励对 GenAI 进行实验并加快部署复合 AI 解决方案来加速 DI 项目的发展。
10、神经符号AI
影响力评级:较高
市场渗透率:不到目标受众的 1%
成熟度:新兴
定义:神经符号 AI 是一种复合 AI,它将机器学习 (ML) 方法与符号系统(例如知识图谱)相结合,以创建更强大、更可靠的 AI 模型。这种融合使概率模型与明确定义的规则和知识相结合,使 AI 系统能够更好地表示、推理和概括概念。这种方法为更有效地解决更广泛的业务问题提供了推理基础架构。
为什么重要
神经符号AI很重要,因为它解决了当前人工智能系统的局限性,例如输出不正确、无法泛化到各种任务以及无法解释导致输出的步骤。这带来了更强大、更通用、更可解释的人工智能解决方案,并允许人工智能系统以类似人类的推理方式处理更复杂的任务。
商业冲击
神经符号AI将对业务流程中使用的人工智能系统的效率、适应性和可靠性产生影响。逻辑和多种推理机制的集成降低了对更大规模人工智能模型及其支持基础设施的需求。这些系统将减少对大量数据处理的依赖,从而使人工智能变得敏捷且具有弹性。神经符号方法可以增强和自动化决策,同时降低意外后果的风险。
驱动因素
-
仅基于机器学习技术的人工智能模型的局限性在于,这些模型侧重于相关性而非理解和推理。最新一代大型语言模型因其倾向于给出事实上错误的答案或产生意外结果而闻名。神经符号AI解决了这些局限性。
-
人工智能输出的解释性和可解释性的需求在受监管的行业用例和使用私人数据的系统中尤为重要。
-
需要优先理解词语背后的含义,而不仅仅是理解词语的排列(语义优先于句法),在处理现实世界实体的系统中,为特定领域的词语和术语赋予意义。
-
可用于组合不同类型 AI 模型的工具集正在不断增加,并且对开发人员、数据科学家和最终用户来说越来越容易使用。主流方法是将不同模型的结果链接在一起(复合 AI),而不是使用单一模型。
-
提供敏捷的人工智能系统所必需的多种推理机制的集成最终将带来自适应人工智能系统,特别是通过类似黑板的机制。
障碍
-
大多数神经符号 AI 方法和技术都是在学术界或行业研究实验室中开发的。尽管工具的可用性不断提高,但在商业或企业环境中的实施仍然有限。
-
目前尚无关于实现神经符号AI的统一技术,尽管出现了现实世界的用例,但研究人员和从业者之间对于结合方法的有效性仍然存在分歧。
-
人工智能初创企业的商业和投资轨迹将几乎所有的资本都分配给了深度学习方法,只有那些愿意押注未来的人才会投资神经符号AI开发。
-
目前,与其他方法相比,大众媒体和学术会议对神经符号AI运动的关注度并不高。
用户建议
-
构建 AI 系统时,采用复合 AI 方法,利用一系列技术提高 AI 模型的稳健性和可靠性。神经符号 AI 方法将适合复合 AI 架构。
-
花时间学习和应用神经符号AI方法,确定可以从这些方法中受益的用例。
-
投资可以利用神经符号 AI 技术构建模块的数据架构,例如知识图谱和基于代理的技术。
-
当生成式人工智能模型的局限性阻碍其在组织中实施时,请考虑神经符号AI架构。
供应商:Google Deep M ind;Elemental Cognition;Franz ;IBM;微软;RelationalAI;Wolfram|Alpha
11、复合人工智能
影响力评级:颠覆
市场渗透率:目标受众的20%至50%
成熟度:早期主流
定义:复合人工智能是指将不同的人工智能技术进行组合应用(或融合),以提高学习效率,拓宽知识表达层次,拓宽人工智能抽象机制,最终提供一个有效解决更广泛业务问题的平台。
为什么重要
复合人工智能认识到,没有任何一种人工智能技术是万能的。它旨在将“联结主义”人工智能方法(如机器学习 (ML) 和深度学习)与“符号”和其他人工智能方法(如基于规则的推理、图形分析或优化技术)相结合。目标是实现需要更少数据和精力来学习的人工智能解决方案,体现更多的抽象机制。复合人工智能是生成式人工智能( GenAI) 和决策智能(DI) 市场的核心。
商业冲击
复合 AI 将 AI 的力量带给了更广泛的组织群体,这些组织无法访问大量历史或标记数据,但拥有丰富的人类专业知识。它有助于扩大 AI 应用的范围和质量(即更多类型的推理挑战)。其他好处包括更好的可解释性和嵌入式弹性以及增强智能的支持。新一波 GenAI 实施严重依赖复合人工智能。
驱动因素
-
决策越来越依赖人工智能,这促使组织走向复合人工智能。通过结合基于规则的模型和优化模型,可以进一步确定最合适的行动——这种组合通常被称为规范分析。
-
数据集较小或数据可用性有限,促使组织将多种 AI 技术结合起来。企业已开始使用其他 AI 技术(例如知识图谱和生成对抗网络 (GAN))来补充稀缺的原始历史数据,以生成合成数据。
-
结合人工智能技术比仅依赖启发式方法或完全数据驱动的方法更有效。启发式或基于规则的方法可以与深度学习模型(例如,预测性维护)相结合。来自人类专家的规则或物理/工程模型分析的应用可能会指定某些传感器读数表明资产运营效率低下。这可以用作训练神经网络以评估和预测资产健康状况的功能,同时集成因果人工智能功能。
-
计算机视觉和自然语言处理 (NLP) 解决方案的激增用于识别或分类图像中的人或物体。此输出可用于丰富或生成图形,表示图像实体及其关系。
-
基于代理的建模是复合 AI 的下一波浪潮。复合 AI 解决方案由多个代理组成,每个代理代表生态系统中的一个参与者。将这些代理组合成一个“群体”,可以创建共同的态势感知、更全局的规划优化、响应式调度和流程弹性。
-
GenAI 的出现正在加速通过工件、流程和协作生成来进行复合 AI 模型的研究和采用,这些都是 DI 平台的基础。
障碍
-
缺乏利用多种人工智能方法的意识和技能:这可能会阻止组织考虑特别适合解决特定问题类型的技术。
-
部署ModelOps:ModelOps 领域(即多个 AI 模型(例如优化模型、规则模型和图形模型)的操作化)仍然是一门艺术,而非一门科学。需要一种强大的 ModelOps 方法来有效管理复合 AI 环境并将其与其他学科(例如 DevOps 和 DataOps)协调一致。
-
信任和风险障碍:人工智能工程学科正在初具规模,但只有成熟的组织才能将其优势应用于人工智能技术的实施。必须在综合人工智能技术中解决安全性、道德模型行为、可观察性、模型自主性和变更管理实践问题。
用户建议
-
确定哪些项目完全由数据驱动、仅使用 ML 的方法效率低下或不适合。例如,在数据不足或无法通过当前 ML 模型表示模式的情况下。
-
通过使用业务规则和知识图谱结合机器学习和/或因果模型进行决策管理,捕获领域知识和人类专业知识,为数据驱动的洞察提供背景。
-
将 ML、图像识别或 NLP 的功能与图形分析相结合,以添加更高级、符号和关系智能。
-
扩展机器学习专家的技能,或招募/提升其他人工智能专家的技能,以涵盖图形分析、优化或其他复合人工智能技术。对于规则和启发式方法,请考虑知识工程技能以及快速工程等新兴技能。
-
通过鼓励对 GenAI 进行实验来加速 DI 项目的开发,这反过来将加速复合 AI 解决方案的部署。
供应商:ACTICO;Aera Technology;FICO;Frontline Systems ;IBM;Indico Data ;Peak ;SAS
12、通用人工智能
影响力评级:颠覆
市场渗透率:不到目标受众的 1%
成熟度:萌芽
定义:通用人工智能 (AGI),又称强人工智能,是(目前假设的)机器智能,可以完成人类可以执行的任何智力任务。AGI 是未来自主人工智能系统的一种特性,它可以在广泛的现实或虚拟环境中实现目标,其效率至少与人类相当。
为什么重要
随着人工智能变得越来越复杂和强大,尤其是最近在生成式人工智能(GenAI)方面取得了巨大进步,越来越多的人认为 AGI 不再是纯粹的假设。提高对 AGI 概念的理解对于指导和规范人工智能的进一步发展至关重要。管理现实的期望并避免过早地将人工智能拟人化也很重要。然而,如果 AGI 成为现实,它对经济、(地缘)政治、文化和社会的影响不容小觑。
商业冲击
短期内,组织必须知道,如今许多利益相关者都对 AGI 大肆宣传,引发了人们对当前 AI 真正能力的恐惧和不切实际的期望。这种对 AGI 的期待已经加速了更多AI 法规的出现,并影响了人们今天应用 AI 的信任和意愿。从长远来看,AI 的力量将继续增强,无论有没有 AGI,它都会对组织产生越来越大的影响,包括机器客户和自主业务的出现。
驱动因素
-
GenAI应用以及基础模型和大型语言或多模态模型的使用最近取得了巨大进展,推动了 AGI 的广泛炒作。这些进步很大程度上得益于深度学习的大规模扩展,以及大量数据和计算能力的可用性。然而,为了进一步将 AI 发展为 AGI,当前的 AI 将需要其他(部分新的)方法的补充,例如知识图谱、多智能体系统、模拟、进化算法、因果 AI、复合 AI 以及其他可能尚未知晓的创新。
-
Google、IBM、OpenAI 等厂商都在公开讨论并积极研究 AGI 领域,给人一种 AGI 触手可及的印象。然而,他们对 AGI 的定义却千差万别,往往有多种解读。
-
人类天生渴望设定远大目标,这也是 AGI 的主要驱动力。历史上,人类曾一度想模仿鸟类飞行。如今,飞机旅行已成为现实。人类头脑的好奇心从大自然和自身中汲取灵感,这种好奇心不会消失。
-
人们倾向于将非生命体拟人化,这种倾向也适用于人工智能机器。ChatGPT 和类似人工智能的类似人类的反应,以及人工智能能够通过多项高等教育考试,都助长了这种趋势。
-
复杂的人工智能系统表现出未经明确编程的行为。除其他原因外,这是由于许多系统组件之间的动态交互造成的。因此,人工智能越来越多地被赋予了类似人类的特征,例如理解力。尽管许多哲学家、神经心理学家和其他科学家认为这种归因太过分或高度不确定,但它让人们觉得 AGI 触手可及,或者至少越来越近了。反过来,这引发了媒体的广泛关注,一些人呼吁制定法规来管理 AGI 的风险,并出于经济、社会和地缘政治原因对人工智能的投资产生了巨大的兴趣。
障碍
-
当前人工智能的不可靠性、缺乏透明度和有限的推理能力很难通过深度学习的内在概率方法克服。更多数据或更多计算能力用于更大的模型不太可能解决这些问题,更不用说实现 AGI 了。
-
“智能”的含义以及“理解”等相关术语几乎没有科学共识,包括对 AGI 的定义和解释。人类大脑和思维的极大复杂性仍然挑战着对人类智能的科学理解。当我们甚至不了解人类智能时,任何关于 AGI 的说法——无论它以何种形式出现——都很难验证。然而,即使 AGI 被正确理解和定义,实现 AGI 也可能需要进一步的技术创新。因此,这里定义的 AGI 不太可能在不久的将来出现。
-
如果AGI 成为现实,很可能会导致自主行为者的出现,随着时间的推移,这些行为者将具有完全的自我学习、代理、身份甚至道德。这将开启人工智能的一系列合法权利,并引发深刻的伦理甚至宗教讨论。AGI还带来了对人类产生负面影响的风险,从失业到人工智能引发的新军备竞赛等等。这可能会引起严重的反弹,禁止或控制 AGI 的法规很可能在不久的将来出现。
用户建议
-
与利益相关者沟通,解决他们的担忧,并创造或维持现实的期望。如今,人们可能过于担心未来人工智能会取代人类,或者对当前人工智能的能力和对业务的影响过于兴奋。这两种情况都阻碍了当今使用人工智能的现实有效方法。
-
随时关注可能预示 AGI 出现的科学和创新突破。同时,继续应用当前的人工智能来学习、获取其好处并制定负责任地使用它的实践。
-
尽管通用人工智能目前尚未实现,但当前的人工智能在偏见、可靠性和其他方面已经带来重大风险。为新兴的人工智能法规做好准备,并促进内部人工智能治理,以管理人工智能的当前和未来风险。
供应商:Aigo;谷歌;IBM;微软;OpenAI
期望膨胀期
13、主权人工智能
影响力评级:较高
市场渗透率:目标受众的20%至50%
成熟度:成长
定义:主权人工智能是主权国家为减少对商业市场的依赖而自主开发和使用人工智能所做的努力。它体现了政治和文化差异,以推进主权目标,包括在制定人工智能战略以实现价值的同时,减少主权造成的伤害。鉴于主权人工智能创新与损失比率存在巨大差异,主权人工智能以意想不到的方式影响着国际关系、全球贸易和经济市场。
为什么重要
主权人工智能反映了主权国家迅速采用人工智能技术,以改善几乎所有内部政府职能和活动与运营目标的协调。虽然它可以增强单个国家的军事防御能力,但其他国家使用人工智能可能会破坏这些国家的安全努力。主权人工智能旨在最大限度地提高人工智能的价值,同时降低人工智能的风险,包括那些合作实现共同目标的主权国家,例如减少人工智能生成的“深度伪造”对政治环境的影响。
商业冲击
主权人工智能影响着政府及其与之互动的企业的几乎所有方面。它通过自动化任务(例如在政府联络中心内)来提高运营效率。由于主权人工智能使政府业务现代化,它可以改善员工体验并加速公民参与。当主权国家控制自己的人工智能系统时,它们会减少对其他主权国家和私人技术市场的依赖。
驱动因素
-
越来越多的国家积极规划和建设自己的人工智能基础设施和能力,以增强竞争力,保障国家未来,发展自己认为可持续的“自主人工智能”。
-
不负责任地使用人工智能可能会对公民和社会造成已知和未知的危害风险,这促使主权国家希望对人工智能系统的发展有更多的控制权,尤其是对生成式人工智能(GenAI)政府用例的控制权。
-
主权实体越来越需要自我监管,包括如何使用其数据来训练大型语言模型 (LLM)。例如,主权国家越来越多地使用人工智能工具来制定重要的政府决策,但我们从客户那里听说,这些决策通常外包给私营公司,没有公众的意见或监督。这种缺乏透明度和问责制的现象促使主权国家自己开发人工智能工具,以解决对这些关键决策过程中潜在偏见和利益冲突的担忧。
-
希望减少对其他国家和技术市场的依赖,包括在无法实现文化和语言投入不足的情况下。
-
主权人工智能在数字主权中发挥着重要作用,因为它专注于对人工智能数据和系统的主权控制,包括对计算能力、数据存储、人力资源访问和人工智能应用开发专有知识的控制。数字主权还可以显著影响主权人工智能的发展,例如,可以使用本地存储的数据来训练人工智能模型。
-
主权人工智能不同于主权数据战略,因为前者的核心重点是人工智能技术的开发者和用户,而不是监管者。主权数据战略反映了国家为监管公民、私营企业和经济的数据和人工智能使用而做出的努力。
-
打击深度伪造泛滥对政治稳定造成的威胁。
-
今天提升政府工作人员的技能,以便明天打造更具人工智能能力的政府工作人员队伍。
-
满足推进地方和国家国防战略日益增长的需求。
-
在新兴技术领域不断进步并保持领导地位。
障碍
-
准备适合人工智能的 IT 基础设施。
-
打造一支拥有人工智能技能的政府劳动力队伍。
-
实现政府文化现代化,以适应先进的分析和自动化。
-
克服已经不堪重负的IT基础设施和分散的业务网络的压力,开发和实施自己的AI系统。
-
缺乏用于训练 LLM 的正确数据,导致 AI 输出的实用性存在差异。
-
缺乏技术熟练的人才参与人工智能的开发和使用生命周期,导致人工智能使用中出现意想不到的负面后果。
-
不同政治和文化背景下的需求和支持的多样性阻碍了主权国家加速在其政府职能中采用人工智能。
-
政治和文化价值观的差异将导致人工智能价值与人工智能危害分析的不一致,从而对国际贸易和全球市场产生不可预测的影响。
-
世界各国对人工智能的发展将导致对人工智能解决方案的要求出现分裂甚至矛盾,其中许多要求是公共或私营部门都无法满足的。
用户建议
寻求以自治和可控的方式发展符合其战略目标的人工智能系统的主权国家应该:
-
从小处着手,优先考虑人工智能的使用,以最大限度地实现利益相关者和政府的业务目标。
-
构建从内部用例到面向公民的人工智能战略路线图。
-
确保人工智能战略识别关键价值机会和风险。
-
与(友好)主权国家合作,加速学习曲线,分享失败分析和意外成功的积极叙述。
-
利用 Gartner 的《成功人工智能战略支柱》引导国家走向人工智能发展的自主管理,创造有形价值并取得具有竞争力的国家领先地位。
14、AI TRiSM
影响力评级:较高
市场渗透率:目标受众的 5% 至 20%
成熟度:早期主流
定义:AI 信任、风险和安全管理 (AI TRiSM) 确保 AI 治理、可信度、公平性、可靠性、稳健性、有效性和数据保护。AI TRiSM 包括模型和应用程序透明度、内容异常检测、AI 数据保护、模型和应用程序监控和操作、对抗性攻击抵抗以及 AI 应用程序安全的解决方案和技术。
为什么重要
AI 模型和应用程序在开发和运行时应受到保护机制的约束。这样做可确保持续创造价值并根据预定意图进行可接受的使用。因此,AI TRiSM 是一个框架,包含一组风险、隐私和安全控制以及信任推动器,可帮助企业治理和管理 AI 模型和应用程序的生命周期,并实现业务目标。这样做的好处是可以改善结果和绩效,并增强对《欧盟 AI 法案》等法规的遵守。
商业冲击
无法持续管理人工智能风险的组织极有可能遭遇不良后果,例如项目失败、人工智能性能不佳和数据机密性受损。不准确、不道德或非预期的人工智能结果、流程错误、不受控制的偏见以及来自良性或恶意行为者的干扰可能会导致安全故障、财务和声誉损失或责任和社会危害。人工智能性能不佳还可能导致组织做出次优或错误的业务决策。
驱动因素
-
OpenAI 的 ChatGPT 使第三方生成式 AI应用程序变得大众化,并改变了企业竞争和工作的方式。因此,托管的基于云的生成式 AI 应用程序的风险巨大且迅速演变。
-
民主化的第三方人工智能应用往往带来相当大的数据保密风险。部分原因是用于训练人工智能模型的大型敏感数据集通常来自各种来源,包括这些应用程序的用户共享的数据。
-
必须严格控制机密数据访问,以避免不利的监管、商业和声誉后果。
-
人工智能风险和安全管理提出了新的运营要求,这些要求尚未被充分理解,现有系统也无法解决。新的供应商正在填补这一空白。
-
必须不断监控人工智能模型和应用,以确保实施合规、公平且合乎道德。风险管理工具可以识别和调整(训练)数据和算法功能中的偏差控制。
-
未经检查的人工智能输出可能会导致组织做出错误的决策或采取有害行为,因为不准确、非法或虚构的信息会影响商业决策。
-
必须通过观察和测试模型和应用程序的输出不断测试 AI 模型和应用程序的可解释性和预期行为。这样做可确保 AI 模型和应用程序的原始解释、诠释和期望在模型和应用程序运行期间保持有效。如果没有,则必须采取纠正措施。
-
检测和阻止对人工智能的对抗性攻击需要大多数企业安全系统所不提供的新方法。
-
人工智能风险管理法规(例如欧盟人工智能法案以及北美、中国和印度的其他监管框架)正在推动企业制定措施来管理人工智能模型和应用风险。这些法规定义了组织在现有法规(例如与隐私保护相关的法规)之外必须满足的新合规要求。
障碍
-
AI TRiSM 通常是事后才考虑的。组织通常直到模型或应用程序投入生产时才会考虑它。
-
与托管大型语言模型 (LLM) 交互的企业缺少自动过滤输入和输出的原生功能。 例如,机密数据政策违规或用于决策的不准确信息。此外,企业必须依赖供应商许可协议来确保其机密数据在主机环境中保持私密。
-
一旦模型和应用程序投入生产,AI TRiSM 就更难以适应 AI 工作流程,从而导致效率低下并使流程面临潜在风险。
-
嵌入人工智能的现成软件通常是封闭的,并且不支持可执行企业策略的第三方产品的 API。
-
大多数人工智能威胁尚未得到充分了解,也未得到有效解决。
-
AI TRiSM 需要一个跨职能团队,包括法律、合规、安全、IT 和数据分析人员,建立共同目标并使用共同框架,这是很难实现的。
-
尽管具有挑战性,但可以使用 AI TRiSM 来实现生命周期控制的集成。
用户建议
-
设立一个组织单位来管理 AI TRiSM。其中包括对 AI 项目有既得利益的成员。
-
在足够精细的级别上定义可接受的使用政策以便于执行。
-
实施数据分类和许可系统以确保企业政策能够得到执行。
-
建立一个系统来记录和批准所有基于人工智能的应用程序,并定期获得用户证明,确保它们是按照预设的意图使用的。
-
使用适当的 AI TRiSM 工具集来管理 AI 模型、应用程序和代理信任风险和安全。
-
要求拥有人工智能组件的供应商提供预期人工智能行为的可验证证明。
-
实施AI数据保护解决方案,并针对不同的用例和组件使用不同的方法。
-
在与托管 LLM 的供应商签订的许可协议中建立数据保护和隐私保证。
-
不断验证和测试组织中使用的所有 AI 的安全性、安全性和风险态势,无论其占用空间如何。
供应商:Aporia;Bosch Global Software Technologies (AIShield);Harmonic;Lasso Security;ModelOp;Prompt Security;Protopia AI;TrojAI
15、提示工程
影响力评级:较高
市场渗透率:目标受众的 5% 至 20%
成熟度:新兴
定义:提示工程是一门学科,以文本或图像的形式向生成式人工智能 (GenAI) 模型提供输入,以指定和限制模型可以产生的响应集。输入会提示一组产生所需结果的响应,而无需更新模型的实际权重(如微调所做的那样)。提示工程也称为“情境学习”,其中提供示例来进一步指导模型。
为什么重要
提示工程是实现业务协调以实现预期结果的关键。这很重要,因为大型语言模型 (LLM) 和 GenAI 模型通常对输入的细微差别和小变化极为敏感。轻微的调整可以将错误答案更改为可用作输出的答案。每个模型都有自己的敏感度级别,提示工程的原则是通过迭代测试和评估来发现敏感度。
商业冲击
提示工程对业务有以下影响:
-
性能:有助于提高模型性能,减少幻觉。
-
业务协调:它允许主题数据科学家、主题专家和软件工程师指导通用的基础模型,以与业务、领域和行业保持一致。
-
上市时间、质量、效率和效果:AI 领导者必须平衡多种架构选项和执行选项。还有无数即时优化工具可以减少(或至少转移)对手动工程的需求。
驱动因素
-
平衡与效率:快速工程的基本驱动力在于,它允许组织在使用“原样”产品与追求更昂贵且耗时的微调方法之间取得平衡。GenAI 模型(尤其是 LLM)是经过预先训练的,因此企业想要与这些模型一起使用的数据不能添加到训练集中。相反,可以使用提示将内容提供给模型,并指示其执行某项功能。
-
特定于流程或任务的定制或新用例:插入模型用来影响生成输出的上下文和模式,允许针对特定企业或领域或监管项目进行定制。创建提示是为了帮助提高不同用例的质量——例如特定领域的问答、总结、分类等——无论是否需要对模型进行微调,因为微调可能很昂贵或不切实际。这也适用于创建和设计利用模型的图像和文本生成功能的新用例。
-
验证和确认:测试、理解和记录模型的局限性和弱点非常重要,以确保降低幻觉和不必要的输出的风险。
障碍
-
提示工程是一门新学科:设计和优化用户对 LLM 或基于 LLM 的聊天机器人的请求以获得最有效结果的技术仍在兴起。工程师们发现,使用 GenAI 创建、调试、验证和重复所需的输出可能具有挑战性。全球社区正在开发新的提示工程方法和技术,以帮助实现这些理想的结果。
-
方法、技术和可扩展性:不存在执行提示工程的统一方法。复杂的场景需要分解成更小的元素。调试复杂的提示具有挑战性。了解特定提示元素如何影响 LLM 的逻辑至关重要。对于大多数组织来说,可扩展且可维护的提示工程方法仍在进行中。
-
角色协调:数据科学家对于理解模型的功能和局限性至关重要,并且对于确定是采用纯粹基于提示还是基于微调的方法(或方法组合)进行定制至关重要。最终目标是使用机器学习本身来生成最佳提示并实现自动提示优化。这与专注于提示设计以手动更改提示以提供更好响应的 LLM 最终用户形成对比。
用户建议
-
建立对提示工程的认识和理解,以快速开始转变适当的提示工程学科和团队的旅程。
-
培养团队成员之间的关键技能,从而协同贡献关键要素。例如,数据科学家、业务用户、领域专家、软件工程师和公民开发者都扮演着重要的角色。
-
向团队介绍多种快速优化工具选项,这将减少(或至少转变)对手动工程的需求。
-
传达并传达快速工程并非万无一失的信息。企业团队以严谨和勤奋的态度进行渗透和工作,以确保解决方案取得成功。
供应商:FlowGPT;谷歌;HoneyHive;Magniv;微软;PromptBase;Salesforce
16、负责任的人工智能
影响力评级:颠覆
市场渗透率:目标受众的 5% 至 20%
成熟度:成长
定义:负责任的人工智能 (RAI) 是采用 AI 时做出适当商业和道德选择方面的总称。这些包括商业和社会价值、风险、信任、透明度、公平性、偏见缓解、可解释性、可持续性、问责制、安全性、隐私和法规遵从性。RAI 涵盖组织责任和实践,以确保积极、负责和合乎道德的 AI 开发和运营。
为什么重要
早期对生成式 AI 的开发使 RAI 重新成为AI 的关键主题。随着AI 大规模发展,既有好的,也有坏的,RAI 通过在降低风险的同时确保业务价值来实现正确的结果。RAI可以采用供应商和企业采用的一系列工具和方法,包括行业特定方法。越来越多的司法管辖区引入了新的法规,推动和挑战组织采用 RAI 实践。
商业冲击
RAI承担个人、组织和社会层面 AI 开发和使用的责任。如果 AI 治理由指定团体实施,RAI 会将其范围扩大到参与 AI 过程的所有利益相关者。RAI有助于实现公平,尽管数据中往往存在偏见;赢得信任,尽管透明度和可解释性方法正在不断发展;并确保遵守法规,尽管 AI 具有概率性。
驱动因素
RAI帮助 AI 参与者开发、实施、利用和解决他们面临的各种驱动因素。随着 AI 的进一步采用,RAI 驱动因素变得越来越重要,供应商、买家、社会和立法者也更好地理解了这些因素:
-
通用人工智能的采用引发了新的担忧,例如幻觉、敏感数据泄露、版权问题和声誉风险,这些都为 RAI 带来了新的参与者(例如在安全、法律和采购领域)。
-
领先的供应商正在为他们的 GenAI 产品提供赔偿,使客户对他们的 RAI 方法更有信心:虽然这是一个很好的举措,但这些仍然不完整。
-
RAI 的组织驱动因素认为需要在监管、业务和道德界限内,在业务价值和相关风险之间取得平衡。这包括重新培训员工以适应人工智能技术和保护知识产权等考虑。
-
社会驱动因素包括解决人工智能安全问题,以造福社会,而不是限制人类自由。现有和未决的法律法规(如欧盟的《人工智能法案》)使 RAI 成为必需品。
-
客户/公民驱动因素基于公平和道德,要求兼顾隐私和便利。客户/公民可能愿意分享他们的数据以换取某些利益。
-
人工智能影响着人们的方方面面,触及社会的各个阶层,因此,RAI 面临的挑战是多方面的,很难一概而论。随着技术及其应用的快速发展,新的问题将不断出现。
障碍
-
RAI的责任界定不明确,使得它在纸面上看起来很好,但实际上却无效。
-
组织缺乏对 AI 意外后果的认识。许多组织只有在体验到 AI 的负面影响后才转向 RAI,而预防则更为简单。
-
大多数人工智能法规仍处于起草阶段。人工智能产品采用隐私和知识产权法规,对组织而言,确保合规性并避免所有可能的责任风险是一项挑战。
-
人工智能技术发展迅速,包括可解释性、偏见检测、隐私保护和一些合规性工具,使组织产生了一种错误的责任感,而光有技术是不够的。除了技术之外,严谨的人工智能伦理和治理方法也是必要的。
-
衡量成功很难。制定 RAI 原则并加以实施,但若不定期衡量进展,则很难维持 RAI 实践。
用户建议
-
在所有 RAI 重点领域宣传一致的方法。企业中最典型的 RAI 领域是公平性、偏见缓解、道德、风险管理、安全、隐私、可靠性、可持续性和合规性。
-
为每个用例指定一名负责人,负责负责任地开发和使用人工智能。
-
定义 AI 生命周期框架。解决该周期各个阶段的 RAI。解决棘手的权衡问题。
-
为员工提供 RAI 培训。将 AI 素养和批判性思维作为培训的一部分。
-
实施 RAI 原则。确保参与者的多样性,并使他们能够轻松表达对 AI 的担忧。
-
加入行业或社会 AI 团体。学习最佳实践并贡献自己的经验,因为每个人都会从这种交流中受益。确保政策考虑到任何内部或外部利益相关者的需求。
供应商:Adobe;Arthur;Fiddler ;谷歌;H2O.ai;IBM;微软;The Responsible AI Institute;SolasAI;TruEra
17、AI工程
影响力评级:较高
市场渗透率:目标受众的 1% 至 5%
成熟度:成长
定义:AI 工程是企业大规模交付 AI 和生成式 AI (GenAI) 解决方案的基础。该学科统一了 DataOps、MLOps 和 DevOps 管道,以创建连贯的企业开发、交付(混合、多云、边缘)和运营(流式、批处理)AI 系统。
为什么重要
受 GenAI 持续炒作的推动,对 AI 解决方案的需求急剧增加。很少有组织能够构建将单个试点项目大规模投入生产所需的数据、分析和软件基础,更不用说大规模运营 AI 解决方案组合了。需要解决的工程、流程和文化挑战十分重大。为了满足扩展 AI 解决方案的需求,企业必须建立一致的 AI 管道,支持 AI 模型(统计、机器学习、生成、深度学习、图形、语言和基于规则)的开发、部署、重用、治理和维护。
商业冲击
AI 工程使组织能够持续安全地建立和发展高价值的 AI 解决方案组合。目前,大多数 AI 开发都受到运营和文化瓶颈的限制。借助 AI 工程方法(DataOps、ModelOps 和 DevOps),可以在结构化、可重复的工厂模型框架中将模型部署到生产中。
驱动因素
-
DataOps、ModelOps 和DevOps为在 AI 开发生命周期中移动工件提供了最佳实践。跨数据和模型管道的标准化加速了 AI 解决方案的交付。
-
消除传统的孤立的数据管理和人工智能工程方法,可以使数据工程工作量加倍,并减少数据提取、处理、模型工程和部署之间的阻抗不匹配,而一旦人工智能模型投入生产,这些不匹配不可避免地会出现偏差。
-
AI 工程使整个企业环境中的AI 工件(数据目录、知识图谱、代码存储库、参考架构、特征存储、模型存储等)可发现、可组合、可重复使用。这些对于在整个企业范围内扩展 AI 至关重要。
-
人工智能工程使得跨混合、多云、边缘人工智能或物联网协调解决方案成为可能。
-
更广泛地使用基础平台为利用现有数据、分析和治理框架扩大人工智能计划的生产提供了初步成功。
-
必须调整 AI 工程实践、流程和工具以应对 GenAI。GenAI 特定的调整包括对即时工程、矢量数据库/图形知识库、多智能体架构和部署以及交互式部署模型的支持。
-
AI 工程工具可以细分为以模型为中心和以数据为中心的工具。DataOps、LLMOps、LangOps 或 FMOps等术语,或 ModelOps 或 MLOps 等更广泛的术语经常使用,但我们认为它们都是 AI 工程的一个子集。
障碍
-
企业范围内基础 AI 计划的资助尚不明确。AI 赋能的变革前景促使高管们积极争夺企业 AI 责任。
-
人工智能工程需要跨领域的管道和平台基础设施的成熟度同时开发。
-
AI 工程需要将功能齐全的解决方案与特定工具(包括开源技术)集成在一起,以尽量减少功能重叠,解决企业架构方面的差距。这些差距包括提取、转换和加载存储、特征存储、模型存储、模型监控、管道可观察性和治理方面的差距。
-
AI 工程需要高度成熟和可能的重新架构,或者能够跨部署环境集成数据和 AI 模型管道。分析和 AI 工作负载的潜在复杂性和管理以及成本可能会阻碍处于 AI 计划初始阶段的组织。
-
企业经常寻求“独角兽”专家来将 AI 平台产品化。临时供应商解决方案会增加成本,并可能使原本就很复杂的集成和模型管理任务变得更加复杂。
用户建议
-
为企业范围的基础 AI 计划建立领导授权。
-
通过建立简化数据、模型和实施流程的 AI 工程实践,最大限度地提高正在进行的 AI 计划的商业价值。
-
通过确定运行端到端 AI 平台和构建 AI 特定工具链所需的功能来简化数据和分析管道。
-
谨慎使用点解决方案,并且仅用于填补功能齐全的 DataOps、MLOps、ModelOps 和PlatformOps 工具中的功能/能力差距。
-
制定人工智能模型管理和治理实践,使模型性能、人类行为和商业价值交付保持一致,让用户更容易采用人工智能模型。
-
利用云服务提供商环境作为构建 AI 工程的基础。同时,在迁移到云时合理化您的数据、分析和 AI 产品组合。
-
采用GenAI 的平台方法,通过投资用于广泛 AI 模型和提供商的自动化、治理和用例支持的集中式 AI 工程工具。
-
提升数据工程和平台工程团队的技能,以采用推动人工智能工件持续集成/持续开发的工具和流程。
供应商:AWS;Dataiku;DataRobot;Domino Data Lab;谷歌;微软;neptune.ai;Octo AI;Seldon Technologies;Weights & Biases
18、边缘人工智能
影响力评级:较高
市场渗透率:目标受众的 5% 至 20%
成熟度:成长
定义:边缘 AI 是指嵌入非 IT 产品(消费/商业)、物联网端点、网关和边缘服务器的 AI 技术。它涵盖消费、商业和工业应用的用例,例如移动设备、自动驾驶汽车、增强的医疗诊断功能和流视频分析。虽然主要侧重于 AI 推理,但更复杂的系统可能包括本地训练功能,以在边缘提供对 AI 模型的优化。
为什么重要
许多边缘计算用例对延迟敏感且数据密集,需要自主进行本地决策。这在广泛的边缘计算和端点解决方案中产生了对基于 AI 的应用程序的需求。示例包括实时分析边缘数据以进行预测性维护、推理以支持决策和视频分析。生成模型(包括较小的语言模型)越来越多地成为实验和投资的领域。
商业冲击
-
实时数据分析和决策智能。
-
提高运营效率,例如制造可识别缺陷、浪费动作、等待以及生产过剩或不足的视觉检测系统。
-
通过产品中嵌入的人工智能的反馈来增强客户体验。
-
通过减少边缘和云之间的数据流量来降低连接成本。
-
无论网络连接如何,功能和解决方案均持久可用。
-
由于仅将优先数据传递到核心系统,因此减少了存储需求。
-
在端点处保留数据隐私。
驱动因素
总体而言,边缘 AI 受益于AI 功能的提升。其中包括:
-
MLOps 和 ModelOps 工具和流程的成熟支持跨更广泛的 MLOps 功能集的易用性。最初,许多公司进入市场时只专注于模型压缩。
-
组合机器学习 (ML) 技术的性能得到提升,数据可用性也随之提高(例如来自工业资产的时间序列数据)。
企业需要仅通过使用边缘人工智能就能实现新的和改进的成果,其中包括:
-
使用基于视觉的监视或检查解决方案来减少全职工作量。
-
通过实现各种流程的自动化来提高制造生产质量。
-
优化跨行业的运营流程。
-
客户体验的新方法,例如移动设备上的个性化或基于边缘的智能结账销售点的零售变化。
-
人们对本地部署生成式人工智能的兴趣日益浓厚。
其他驱动因素包括:
-
越来越多的用户在既有环境中升级旧系统和基础设施。通过使用 MLOps 平台,AI 软件可以托管在边缘计算机或网关(聚合点)中,或嵌入到具有必要计算资源的产品中。
-
越来越多的制造商将AI 嵌入到终端中,作为产品服务化的一部分。在这种架构中,物联网 (IoT) 终端(例如汽车、家用电器和商业建筑基础设施中的终端)能够运行 AI 模型来解释终端捕获的数据并驱动某些终端的功能。
-
针对自适应 AI,在边缘训练去中心化 AI 模型的研发需求不断增长。这些新兴解决方案是由明确的需求推动的,例如隐私保护或机器和流程在断开连接(远离云端)的场景中运行的要求。
障碍
-
边缘人工智能受到所部署设备的应用和设计限制的制约;这包括外形尺寸、功率预算、数据量、决策延迟、位置和安全要求。
-
部署人工智能技术的系统可能具有不确定性。这将影响某些用例的适用性,尤其是在安全性和保障性要求很重要的情况下。
-
基于某些机器学习和深度学习技术的边缘 AI 解决方案的自主性经常带来信任问题,尤其是在推理不易解释或说明的情况下。随着自适应 AI 解决方案的增加,如果最初部署到等效端点的相同模型随后开始出现不同的行为,这些问题将会增加。
-
缺乏高质量且足够的训练数据是人工智能应用面临的普遍挑战。
-
神经网络中的深度学习是一项计算密集型任务,通常需要使用具有相应高功率预算的高性能芯片。这可能会限制部署位置,尤其是在小尺寸和低功耗要求至关重要的地方。
用户建议
-
确定使用边缘 AI 是否能够提供足够的成本效益改进,或者传统的集中式数据分析和 AI 方法是否足够且可扩展。
-
评估何时考虑边缘 AI 而不是集中式解决方案。边缘 AI 的良好候选者是那些通信成本高、对延迟敏感、需要实时响应或在边缘提取大量数据的应用程序。
-
评估可用于支持边缘 AI 的不同技术以及提供这些技术的供应商的可行性。许多潜在供应商都是初创公司,他们可能拥有有趣的产品,但支持能力有限。
-
使用边缘网关和服务器作为聚合和过滤点来执行大多数边缘 AI 和分析功能。计算密集型端点除外,因为基于 AI 的分析可以在设备本身上执行。
供应商:Chooch;Edge Impulse;IFS(Falkonry );Litmus Automation;MicroAI
19、基础模型
影响力评级:颠覆
市场渗透率:目标受众的20%至50%
成熟度:早期主流
定义:基础模型是大参数模型,以自监督方式在广泛的数据集上进行训练。它们大多基于 Transformer 或扩散深度神经网络架构,并且正日益成为多模态模型。它们之所以被称为基础模型,是因为它们对各种下游用例至关重要且适用。这种广泛的适用性归功于模型的预训练和多功能性。
为什么重要
基础模型是人工智能向前迈出的重要一步,因为它们具有大量的预训练和广泛的用例适用性。它们可以提供最先进的功能,并且比其前身更有效。它们已成为自然语言处理的首选架构,并且还应用于计算机视觉、音频和视频处理、软件工程、化学、金融和法律用例。
商业冲击
基础模型具有增强各种企业用例应用程序的潜力,因此将对垂直行业和业务功能产生广泛影响。随着越来越多的初创企业在其基础上构建企业应用程序,基础模型的影响正在加速。基础模型将通过提高员工生产力、自动化和增强客户体验以及快速、经济高效地创建新产品和服务来推动企业内部的数字化转型。
驱动因素
-
缩短价值实现时间 — 基础模型可以通过预构建 API、快速工程、检索增强生成或进一步微调有效地实现价值。虽然微调可以实现更多定制,但其他两个选项不太复杂、更快速且更便宜。
-
跨多个领域的卓越性能 —这些模型与之前的神经网络解决方案之间的差异是显而易见的。大型预训练模型可以以前所未有的规模和准确性生成连贯的文本、代码、图像、语音和视频。
-
创新步伐加快 —过去一年涌现了大量基础模型,以及基于这些模型构建的小型预训练领域特定模型。其中大多数都以云 API 或开源项目的形式提供,进一步减少了实验时间和成本,并推动了企业更快地采用这些模型。
-
生产力提升 —随着基础模型自动化任务的能力不断增强,其对企业业务职能的广泛影响也日益显现。客户寻求初步收益的领域包括营销、客户服务和 IT(尤其是软件工程)。
障碍
-
无法提供完美的结果 —尽管取得了重大进展,但基础模型仍需要仔细训练和保护。由于其训练方法和黑箱性质,它们可能会提供不可接受的结果或幻觉。它们还可能向下游传播数据集中的任何偏见或版权问题。
-
需要适当的技能和人才——与所有人工智能解决方案一样,最终结果取决于培训人员和用户的技能、知识和才能,特别是对于及时的工程和微调。
-
扩展到不切实际的规模——大型模型的参数多达数十亿或数万亿。对于大多数组织来说,由于需要计算资源,这些模型的规模太大,难以进行训练,这会导致成本高昂且不利于生态环境。
-
权力集中——这些模式大多由最大的科技公司建立,它们拥有巨额研发投资和大量人工智能人才,导致权力集中在少数几个财力雄厚的大型实体手中。这种情况可能会在未来造成严重的不平衡。
用户建议
-
创建一份战略文件,概述这些模型在协作方面的利益、风险、机会和执行计划。
-
计划将基础模型引入现有的语音、文本或编码领域。如果有任何较旧的语言处理系统,则迁移到基于转换器的模型可以显著提高性能。知识搜索、摘要、内容生成是各行各业流行的新兴用例。
-
从具有卓越生态系统支持和足够的企业安全和隐私护栏的模型开始,并进行更广泛的部署。
-
在选择基础模型以确定所需的合适模型时,要客观地考虑准确性、成本、安全性和隐私性以及价值实现时间之间的适当平衡。考虑到复杂性和高昂的成本,请谨慎从头开始构建模型。
-
对开发人员、数据和分析团队进行指导这些模型所需的快速工程和其他先进技术。
-
指定一个孵化团队来监控行业发展,交流可能性的艺术,与业务部门进行实验,并在公司范围内分享宝贵的经验教训。
供应商:阿里巴巴;Anthropic;Cohere;Databricks;谷歌;Hugging Face;IBM;微软;Mistral AI;OpenAI
20、合成数据
影响力评级:较高
市场渗透率:目标受众的 5% 至 20%
成熟度:成长
定义:合成数据是一类人工生成的数据,而不是通过直接观察现实世界获得的数据。合成数据在各种用例中用作真实数据的代理,包括数据匿名化、人工智能和机器学习 (ML) 开发、数据共享和数据货币化。
为什么重要
当今人工智能发展的一个主要问题是获取真实数据并对其进行标记的负担。这项耗时且昂贵的任务可以通过合成数据来解决,因为可以更快、更便宜地生成数据。此外,对于自动驾驶汽车训练模型等特定用例,收集真实数据以 100% 覆盖边缘情况几乎是不可能的。此外,合成数据可以在没有个人身份信息 (PII) 或受保护的健康信息 (PHI) 的情况下生成,使其成为一种有价值的隐私保护技术。
商业冲击
各行各业都在越来越多地采用合成数据。Gartner 预测,合成数据的采用将大幅增加,因为:
-
避免在通过原始数据的合成变体或部分数据的合成替换来训练 ML 模型时使用 PII。
-
降低 ML 开发成本并节省时间。
-
由于更多的训练数据可以带来更好的结果,因此提高了 ML 性能。
-
使组织能够探索几乎没有实际数据的新用例。
-
能够更有效地解决公平问题。
驱动因素
-
在医疗保健和金融领域,买家的兴趣正在增长,因为合成表格数据可用于保护人工智能训练数据的隐私。
-
为了满足自然语言自动化训练(尤其是聊天机器人和语音应用程序)对合成数据日益增长的需求,新老供应商都在向市场推出新产品。这扩大了供应商格局并推动了合成数据的采用。
-
合成数据应用已经超越汽车和计算机视觉用例,包括数据货币化、外部分析支持、平台评估和测试数据的开发。
-
Transformer和扩散架构是生成式人工智能 (GenAI) 的架构基础,它们能够以前所未有的质量和精度生成合成数据。人工智能模拟技术通过更好地重现现实世界的表征来提高合成数据的质量。
-
还扩展了其他数据类型。虽然表格、图像、视频、文本和语音应用很常见,但研发实验室正在将合成数据的概念扩展到图形。合成生成的图形将与原始图形相似,但不重叠。随着组织开始更多地使用图形技术,我们预计这种方法将成熟并推动采用。
-
GenAI 模型的日益普及以及此类模型的未来定制将推动对这些模型进行预训练的合成数据的需求。
障碍
-
合成数据可能存在偏差问题,错过自然异常,开发起来很复杂,或者不会为现有的现实世界数据贡献任何新信息。
-
数据质量与生成数据的模型相关。
-
关于如何结合合成数据和真实数据进行人工智能开发,目前还没有明确的最佳实践。
-
合成数据生成方法缺乏标准化。
-
很难验证合成数据的准确性。虽然合成数据集可能看起来真实准确,但很难确定它是否准确地捕捉到了底层的现实世界环境。
-
由于缺乏技能,买家仍然对何时以及如何使用该技术感到困惑。
-
合成数据仍可能泄露有关组织的大量敏感信息,因此安全和隐私问题值得关注。机器学习模型可以通过主动学习进行逆向工程。通过主动学习,学习算法可以以交互方式询问用户(或其他信息源)以使用所需输出标记新数据点,这意味着学习算法可以主动询问用户或教师以获取标签。
-
如果边缘情况不是种子数据集的一部分,则不会对其进行合成。这意味着必须谨慎处理此类边缘情况。
-
用户可能会产生一定程度的怀疑,因为数据可能被认为是“劣质的”或“假的”。
用户建议
-
确定组织中哪些领域数据缺失、不完整或获取成本高昂,从而阻碍了 AI 计划的实施。在医疗保健或金融等受监管的行业中,请谨慎行事并遵守规则。
-
当需要个人数据但又要求数据隐私时,使用原始数据的合成变体,或部分数据的合成替换。
-
通过培训计划向内部利益相关者普及合成数据的优点和局限性。制定防护措施以缓解用户怀疑和数据验证不充分等挑战。
-
衡量并传达合成数据计划的商业价值、成功和失败案例。
供应商:Anonos(Statice);Datagen;Gretel;Hazy ;Howso;MOSTLY AI;Parallel Domain;Rendered.ai;Tonic .ai;YData
21、模型运营
影响力评级:较高
市场渗透率:目标受众的 1% 至 5%
成熟度:新兴
定义:模型运营(ModelOps)主要关注高级分析、人工智能和决策模型的端到端治理和生命周期管理,例如基于机器学习(ML)、生成人工智能(GenAI)、知识图谱、规则、优化、语言学、代理等的模型。
为什么重要
ModelOps帮助公司标准化、扩展和增强其分析和 AI 计划。它帮助组织将其模型从实验室环境转移到生产环境中。MLOps主要专注于 ML 模型的监控和治理,而 ModelOps 则协助所有高级分析、决策和 AI 模型的运营和治理,包括Gen AI 和检索增强生成 (RAG)系统。
商业冲击
ModelOps 作为一种实践:
-
提供管理和运营各种人工智能、分析和决策系统的能力。
-
支持 AI、分析和决策系统可观察性所需的复杂子系统,包括版本控制、监控、自动化、数据编排、实验和可解释性。
-
确保更广泛的业务、开发和部署社区之间的协作,以及将 AI、分析和模型结果与业务 KPI 关联起来的能力。
驱动因素
-
现代人工智能系统正在构建中,其结合了生成式和经典人工智能模型、代理和智能软件功能。随着组织中高级分析、人工智能和决策模型的数量不断增加,组织将不得不在生产中管理不同类型的预打包或定制模型。
-
组织希望不仅在模型方面,而且在数据、应用程序和基础设施方面,都能够更加灵活、更加迅速地响应其高级分析和人工智能管道中的变化。
-
ModelOps 提供了一个框架,用于将各个团队的职责分开,以决定如何在不同环境(例如开发、测试和生产)中构建、测试、部署和监控模型(包括Gen AI、基础模型、分析、ML、物理、模拟、符号等)。这可以提高生产力和协作,并降低故障率。
-
ModelOps 提供了解决因漂移和偏差导致的模型退化问题的工具。在其他情况下,实现模型治理、可解释性和完整性至关重要。
-
ML 模型的运营挑战并不是什么新鲜事,但使用 ModelOps 在组织级别实现多样化模型生产的能力仍在不断发展。
-
组织不想部署无限数量的开源产品来管理 ModelOps,但很少有全面的解决方案能够在模型运营的每个领域提供端到端功能。此外,并不是每项功能都是立即需要的。通常,版本控制、监控和模型编排先于功能存储、管道和可观察性的全面实施。
-
GenAI 将需要更加注重测试,并引入版本控制、管理和自动化提示、路由器和检索增强生成系统的功能。微调还需要增强 ModelOps 功能来管理复杂的域和功能训练数据集。
障碍
-
使用不同类型模型的组织通常无法构建正确的运营、治理和管理能力,直到他们已经拥有一个混乱的无人管理的高级分析系统格局。
-
目前,并非所有分析技术都能从成熟的运营方法中获益。由于人们一直关注 ML 技术,MLOps 受益于更先进的 AI 实践,但有些模型(如代理建模和优化技术)需要在 ModelOps 实践和平台中得到更多关注。
-
帮助 GenAI 投入生产的 ModelOps 功能正在兴起,但尚不成熟。此外,由于数据、安全和监管方面的担忧,组织难以将 GenAI 投入生产。
-
组织可能会采用他们并不立即需要的 ModelOps 平台功能。同时,如果组织各自为政且未能采用全面的 ModelOps 战略,则在运营方面会造成工作冗余。
用户建议
-
购买集成到主要 AI 平台的 ModelOps 功能。通过一流的开源或专有 ModelOps 产品丰富这些功能,其中独特问题(如功能存储或可观察性)需要增强的解决方案。
-
利用复合 AI、数据、模型和应用程序中的 ModelOps 最佳实践来确保过渡、减少摩擦并增加价值创造。
-
招募/提升更多工程师,使他们能够掌握利用非结构化数据、搜索、图形和优化的 AI 系统上的 ModelOps 。
-
鼓励开发和部署团队之间的协作,并授权团队做出决策,以实现分析和 AI管道的自动化、扩展和稳定性。
-
与软件工程团队合作以扩展 ModelOps。将运营责任转移给生产支持团队,可以提高整个复杂的 AI 应用生态系统中 ModelOps 的专业化和复杂化程度。
供应商:DataRobot;IBM;ModelOp;Modzy;Neptune.ai;OctoAI;SAS;Valohai;Verta;Weights & Biases
22、生成式人工智能
影响力评级:颠覆
市场渗透率:目标受众的20%至50%
成熟度:成长
定义:生成式人工智能 (GenAI) 技术可以通过从大量原始源内容库中学习来生成内容、策略、设计和方法的新派生版本。生成式人工智能对业务有着深远的影响,包括内容发现、创作、真实性和法规;人类工作的自动化;以及客户和员工体验。
为什么重要
GenAI 探索正在不断扩大:
-
最终用户组织积极尝试 GenAI。大多数行业的早期采用者都已在 GenAI 方面取得了初步成功。
-
主要技术供应商优先提供支持 GenAI 的应用程序和工具。
-
众多解决方案纷纷涌现,为 GenAI 的基础模型、硬件和数据进行创新。
-
受到 GenAI 热潮的影响,各国政府正在出台人工智能法规并投资国家人工智能战略。
商业冲击
业务重点正从对基础模型的兴奋转向推动投资回报的用例。大多数 GenAI 实施目前都是低风险和内部的。随着生产力工具和 AI 治理实践的快速发展,组织将在行业垂直领域和科学发现中为更关键的用例部署 GenAI。从长远来看,支持 GenAI 的对话界面将促进技术商业化,使 AI 和其他技术民主化。
驱动因素
-
GenAI 的行业应用正在不断增长。GenAI 已在娱乐、营销、设计、音乐、建筑和内容生成等领域开展创意工作。
-
首次全企业部署发现了最佳实施实践,并推动了顶级 GenAI 企业用例的发展:高级聊天机器人、编码协助和内部服务台。根据 2023 年 Gartner 企业 AI 调查,18% 高度参与 AI 的领导者报告称,他们的组织在 GenAI 采用方面处于领先地位。
-
GenAI 是各大技术供应商竞争最激烈的领域。他们在基础模型产品、企业就绪性、定价、基础设施、安全性和赔偿方面展开竞争。
-
新版本、新尺寸和新功能的新基础模型正在迅速上市,使 GenAI 可用于更多用例。提高模型稳健性的工具(例如矢量数据库、图形技术、LLM 测试、安全保护和开源资源)使 GenAI更加可用。
-
Gemini 或 GPT4-Video 等多模态模型的进步意义重大,这些模型经过训练可以同时接收图像和文本;例如,它们允许用户提出有关图像的问题并通过文本获得答案。模型可以结合概念、属性和风格来创建原创图像、视频和艺术,或将音频翻译成不同的声音和语言。值得注意的是,文本到图像/视频的生成已经取得了进展,能够根据文本描述创建高度详细和逼真的视觉效果。
-
企业正在学习通过快速工程和微调将自己的数据与 GenAI 结合使用。适用于 AI 的数据和相关元数据已成为 GenAI 战略的核心。
-
合成数据可帮助企业增强稀缺数据、减轻偏见、实现超分辨率或保护数据隐私。
-
GenAI 颠覆了软件工程。开发自动化技术有望使 5% 到 10% 的程序员工作实现自动化。组织现在愿意使用 GenAI 来解决遗留系统的现代化问题。
障碍
-
GenAI 引发了新的伦理和社会问题。政府法规可能会阻碍 GenAI 研究。待定法规不断增多。
-
幻觉、偏见、黑盒特性以及对完整 AI 生命周期的缺乏经验,目前阻碍了 GenAI 在关键用例中的使用。
-
GenAI 的责任、许可和定价在各个提供商之间并不一致,可能会让客户措手不及。
-
重现结果并找到所生成信息的参考资料具有挑战性,但一些验证解决方案正在出现。
-
安全专业人员对于认证和保护 GenAI 解决方案还很陌生;安全最佳实践的形成需要时间。
-
GenAI 被用于邪恶目的。全面准确地检测生成的内容(例如深度伪造和虚假信息)仍将具有挑战性或不可能。
-
大多数企业都负担不起用于训练 GenAI 模型的计算资源。人们对 GenAI 高能耗的可持续性担忧日益加剧。
用户建议
-
确定低风险用例,可以依靠购买的功能使用 GenAI 改善业务。查阅供应商路线图,避免在内部开发类似的解决方案。
-
构建GenAI 解决方案以做好近期升级的准备,因为它们的基础模型和数据工具正在快速发展。
-
试行由机器学习驱动的编码助手,着眼于快速推出,以提高开发人员的工作效率。
-
使用合成数据来加速开发周期并减少监管问题。
-
量化 GenAI 的优势和局限性。发布 GenAI 政策和指南,因为它需要技能、资金和谨慎。
-
通过与法律、采购、安全和反欺诈专家合作来降低 GenAI 风险。技术、制度和政治干预对于对抗 AI 的对抗性影响至关重要。
-
采用复合 AI 方法将 GenAI 与其他 AI 技术相结合,优化 AI 解决方案的成本和效率。
供应商:阿里云;AWS;Anthropic;谷歌;Hugging Face;IBM;Meta;微软;Mistral AI ;OpenAI
泡沫破裂低谷期
23、神经形态计算
影响力评级:颠覆
市场渗透率:不到目标受众的 1%
成熟度:萌芽
定义:神经形态计算是一种利用数字或模拟处理技术更准确地模拟生物大脑运作的机制的技术。这些设计通常使用脉冲神经网络 (SNN) 而不是深度神经网络 (DNN),采用非冯·诺依曼架构,处理单元简单,但互连性极高。
为什么重要
目前,大多数 AI 开发都使用基于图形处理单元 ( GPU ) 的并行处理设计。这些设备性能高,但功耗高,在许多部署中并不适用。神经形态计算采用异步、基于事件的设计,有可能提供极低功耗操作。这使得它们特别适合边缘和端点设备,它们支持对象和模式识别的能力可以实现图像、音频和传感器分析。
商业冲击
-
神经形态计算架构有可能以极低的功率为用例模式识别和信号分析提供极高的性能,并且可以使用比其他人工智能模型更小的数据集进行训练,并具有现场训练的潜力。
-
神经形态计算设计可以使用低功耗设备来实现,这有可能将人工智能技术的覆盖范围扩展到网络边缘,从而加速图像和声音识别等关键任务。
驱动因素
-
当今的 DNN 算法和大型语言模型 (LLM) 需要使用高性能处理设备和大量数据来训练这些系统,从而限制了部署范围。
-
人们正在采用不同的设计方法来实现神经形态计算设计——用于数据中心的大型设备,以及用于边缘计算和端点设计的小型设备。这两种方法都利用 SNN 来实现异步设计,与当前基于 DNN 的设计相比,这种设计具有极低的功耗优势。
-
半导体供应商正在开发利用 SNN 实现基于 AI 的解决方案的芯片。
障碍
-
可访问性:与神经形态计算相比,GPU 更易于访问且更易于编程。然而,当神经形态计算和支持生态系统成熟时,这种情况可能会改变。
-
知识差距:编程神经形态计算将需要新的编程模型、工具和训练方法。
-
可扩展性:互连的复杂性对半导体制造商创造可行神经形态设备的能力提出了挑战。
-
集成:要想与其他 AI 架构竞争,就需要在架构和实现方面取得重大进展。DNN 和 LLM 架构的快速发展可能会减缓神经形态计算的进步,但未来十年可能会取得重大飞跃。
用户建议
-
为未来的应用做好准备,因为神经形态架构有可能在未来五年内变得可行。
-
通过确定可以从神经形态计算中受益的关键应用来创建路线图计划。
-
与神经形态计算领域的关键行业领导者合作开发概念验证项目。
-
确定成功开发神经形态计划所需培养的新技能组合,并建立一套业务成果或预期价值来设定管理层的长期期望。
供应商:AnotherBrain;Applied Brain Research;BrainChip;GrAI Matter Labs;英特尔;Natural Intelligence;SynSense
24、智能机器人
影响力评级:较高
市场渗透率:目标受众的 1% 至 5%
成熟度:新兴
定义:智能机器人是一种由人工智能驱动、通常可移动的机器,旨在自主执行一项或多项物理任务。这些任务可能依赖于机器学习,或产生机器学习,机器学习可以融入未来的活动或支持前所未有的条件。智能机器人可以根据任务或用例分为不同类型,例如个人、物流和工业。
为什么重要
智能机器人是人工智能的一个用例,而一般的机器人并不意味着人工智能。与工业机器人相比,智能(物理)机器人的采用率较低,但在市场上却大受欢迎。今年,智能机器人的排名上升了好几位。这是因为过去 12 个月对智能机器人的兴趣和投资有所增加,因为公司希望进一步改善物流运营、支持自动化并增强人类在各种工作中的技能。
商业冲击
智能机器人将在以资产、产品和服务为中心的广泛行业中产生初步业务影响。它们能够降低人类的身体风险,同时以更高的可靠性、更低的成本和更高的生产率完成工作,这在这些行业中很常见。智能机器人已经在人类中部署,用于物流、仓储和安全应用。
驱动因素
-
过去两年来,随着技术的发展,市场变得更加活跃,出现了大量新的用例,改变了人们对智能机器人的看法以及它们如何创造价值。
-
随着处理器、摄像头和传感器等组件的成本逐渐下降,机器人的价格也变得更加实惠。
-
智能机器人的物理构造模块(电机、执行器、底盘和车轮)随着时间的推移不断改进。同样,物联网 (IoT) 集成、边缘 AI 和对话功能等领域也取得了根本性的突破。这些改变了机器人部署的范式。
-
供应商的专业化程度不断提高,从而带来了具有更高商业价值的解决方案,因为通用/多用途设备要么不可能实现,要么价值较低。
-
各行各业对智能机器人的兴趣日益浓厚。智能机器人用于执行医疗/保健、制造、最后一英里配送、工业物体或设备检查、农业、工作场所等各种任务。
-
智能机器人仍是一项新兴技术,但随着供应商扩大产品范围并探索新技术,未来几年,人们对它的炒作和期望将不断增加。增加强化学习等功能将有助于推动机器人和群体管理的持续学习循环。
障碍
-
企业仍在努力寻找有价值的商业用例并评估机器人的投资回报率,特别是在制造业和运输业之外的领域。
-
任务的复杂性和多样性要求复杂的决策。目前的智能机器人擅长重复性和可预测性的任务,并且能够适应各种任务。
-
定价模式和购买选项的不断演变和缺乏通用性给组织带来了不确定性。公司很难比较和规范他们遇到的所有各种购买选项,例如按月租赁、按小时收费、机器人即服务或直接购买机器人。
用户建议
-
评估智能机器人作为制造、分销、物流、零售、医疗保健或国防领域人类劳动力的替代品和补充。
-
开始进行旨在评估产品能力和量化收益的试点,尤其是因为即使小规模部署也可能获得投资回报。
-
随着在该领域获得更多经验,请做好准备采用和改进您的流程和机器人策略。
-
检查当前的业务流程并根据需要重新设计以支持智能机器人的部署。
-
考虑智能机器人的不同购买模式,例如机器人即服务或混合资本支出/运营支出模式。
-
通过开发培训资源来引入机器人作为人类助手,消除员工的不情愿。
-
确保未来两年内有足够的云计算资源来支持高速、低延迟的连接。
-
由于机器人领域的分散,需要评估多个全球和区域供应商。
供应商:Ava Robotics;Geekplus;GreyOrange ;HAHN Group (Rethink Robotics);iRobot;Locus Robotics;SoftBank Robotics;Symbotic;temi ;UBTECH Robotics
25、云端人工智能服务
影响力评级:较高
市场渗透率:目标受众的 5% 至 20%
成熟度:早期主流
定义:云 AI 服务提供 AI 模型构建工具、预构建服务的 API 和相关中间件,支持以云服务的形式在预构建基础设施上运行机器学习 (ML) 和生成式 AI 模型的构建/训练、部署和使用。这些服务包括预训练的视觉、语言和其他生成式 AI 服务,以及自动化 ML 和微调,以创建新模型并自定义预构建模型。
为什么重要
云AI服务的使用持续增加。供应商推出了其他服务,包括大型语言模型 (LLM) API 和具有完全集成的 MLOps 管道的解决方案。低代码工具的添加增加了易用性。应用程序经常在语言、视觉和表格数据和代码生成中使用 AI 云服务来自动化和加速业务流程。开发人员了解这些产品,并且越来越多地在应用程序中使用预构建和定制的 ML 模型。
商业冲击
云AI 服务影响运行业务的应用程序,使开发人员能够增强应用程序功能。生成式 AI 为这些解决方案添加了一个新类别,允许对LLM 进行微调以定制性能。数据驱动的决策要求纳入 ML 模型以添加应用程序功能。一些 AI 技术正在成熟,但生成式 AI 包含的功能不太成熟。云 AI 服务通过评分、预测和生成内容的模型增强应用程序,从而实现数据驱动的业务运营。
驱动因素
-
利用新见解的机会。来自内部和第三方来源的大量数据提供了见解,例如结合预测性 ML 模型,从而在应用程序中实现数据驱动的决策智能。
-
支持对话式交互的需求。生成式人工智能和大型语言模型的出现促进了对话式应用程序的发展,用户可以使用 LLM 结合数据源来获取见解。
-
需要满足业务关键绩效指标 (KPI) 。企业必须通过部署AI 和 ML 模型来实现流程自动化,以提高准确性、响应能力并降低成本。
-
降低准入门槛。使用预训练的生成式 AI 模型并对其进行微调的能力减少了训练模型所需的大量数据。由于有可调用 API 的 LLM,开发人员和公民数据科学家可以访问 AI 和 ML 服务,这将进一步扩大开发团队对 AI 的使用。
-
自动化机器学习可促进定制开发。使用自动化机器学习来定制打包服务以满足业务的特定需求更加容易,并且不需要数据科学家。
-
种类繁多的云AI 服务。市场上有多种专业提供商提供云 AI 服务,包括简化解决方案部署的编排层。
-
新兴的人工智能模型市场。新的市场应该通过云计算人工智能服务帮助开发人员采用这些技术。
障碍
-
开发人员和公民数据科学家不了解如何使这些服务适应特定的用例。
-
生成式 AI 模型的落地是一项艰巨的任务,需要精心设计的检索增强生成 (RAG) 解决方案,这些解决方案通常包括向量嵌入和其他功能。许多 CAIDS 提供商将这些功能作为其生成式 AI 产品的一部分提供。
-
基于使用量的云计算人工智能服务定价模型会给企业带来风险,因为使用这些服务的成本可能会迅速增加。需要全面的成本建模工具来解决此问题。
-
面向开发人员和公民数据科学家的利用多种服务的打包解决方案的需求不断增加。
-
支持将 AI 和 ML 模型集成到应用程序中的ModelOps工具的可用性有限。
-
开发人员缺乏及时的工程和微调等技能,无法以负责任的方式有效地实施这些服务。
用户建议
-
选择可定制的云AI 服务而不是定制模型来解决一系列用例并实现更快的部署和可扩展性。
-
通过试验 AI 技术(包括使用 LLM 和多模态模型等生成式 AI 模型以及其他云服务)来提高 AI 战略的成功率。随着技术的快速发展,确保生成式 AI 模型保持松散耦合。
-
使用云计算 AI 服务来构建不太复杂的模型,享受更高效的人工智能的好处,同时释放数据科学资产以用于更高优先级的项目。
-
为非数据科学家提供自动算法选择、数据集准备和项目元素特征工程等功能。利用现有的运营云服务的专业知识来协助技术专业团队。
-
利用预先训练的生成式 AI 模型,可以快速构建原型并部署支持 LLM 的解决方案。
-
开发成本建模工具,使企业能够在整个业务的应用程序中广泛部署 AI 模型,从而有效地预测使用成本和管理成本。
供应商:阿里云;AWS;百度;谷歌;H2O.ai;IBM;微软;NVIDIA ;甲骨文;腾讯
稳步爬升复苏期
26、自动驾驶汽车
影响力评级:颠覆
市场渗透率:不到目标受众的 1%
成熟度:新兴
定义:自动驾驶汽车使用各种车载传感和定位技术,例如激光雷达、雷达、摄像头、全球导航卫星系统 (GNSS) 和地图数据,结合基于人工智能的决策,无需人工监督或干预即可行驶。自动驾驶汽车技术正应用于乘用车、公共汽车和卡车,以及采矿和农业拖拉机等特定用例。
为什么重要
自动驾驶汽车有可能改变交通经济,降低运营成本并提高车辆利用率。在城市地区,廉价的票价和高质量的服务可能会减少私家车的拥有需求。道路安全将提高,因为人工智能系统永远不会分心、酒后驾驶或超速行驶。私家车上的自动驾驶功能将使人们能够进行生产和娱乐活动,而车辆则负责驾驶操作。
商业冲击
自动驾驶汽车通过提供基于软件的驱动因素(作为服务的一部分出售)打开了颠覆传统汽车商业模式的潜力,这将产生高利润收入。自动驾驶系统将刺激对车载计算的需求以运行人工智能软件,从而大幅增加车辆的整体物料清单。继办公室和家庭之后,汽车将成为可以创建和消费数字内容的空间。随着时间的推移,车队运营商可能会重新培训并重新部署他们的人类商业司机,让他们担任公司内其他更高附加值的职位。
驱动因素
-
自动驾驶汽车法规和标准的正式化将有助于实施。自动车道保持系统 (ALKS) 技术已获得联合国欧洲经济委员会 ( UNECE ) 的批准。这是SAE 3 级汽车自动化的首个具有约束力的国际法规,最高运行速度为 37 英里/小时。随着新的监管环境,全球汽车制造商开始宣布 3 级解决方案。
-
梅赛德斯-奔驰是首家获得国际有效系统认证的汽车制造商,并已在德国推出该系统。在美国,其 Level 3 解决方案已在内华达州和加利福尼亚州获得认证。宝马已宣布推出 Personal Pilot L3 功能,该功能可自动控制汽车的速度、与前方车辆的距离以及车道定位,目前该功能已在新款 7 系车型上提供。在中国,长安、长城汽车和小鹏汽车均已宣布推出 Level 3 系统。
-
自动驾驶汽车市场预计将从 ADAS 系统逐渐发展到乘用车的更高水平自动驾驶,而不是以自动驾驶出租车为基础的革命。这将需要灵活的车辆操作设计域 (ODD)。
-
自动驾驶卡车是一个引人注目的商业案例。司机工资是与商业卡车相关的车队最大的运营成本之一,此外,由于不再需要休息,货物可以更快地运送到目的地。Aurora Driver 产品目前处于“功能完整”阶段,计划在 2024 年底推出“中间一英里”无人驾驶卡车服务。
-
借助GenAI生成合成数据的能力,可以加速模拟中AI算法的训练。
-
对于越野用例,自动驾驶汽车可以协助、替代或重新部署人类工人,以提高工作准确性、降低运营成本并提高工人安全性。
障碍
-
由于设计自动驾驶汽车的复杂性,将商业模型推向市场的成本高于公司的预期,需要大量投资。
-
当自动驾驶汽车投入商业化使用时,汽车开发商(而非人类乘客)将对汽车的自动驾驶运行负责。如果汽车发生事故,则需要特定的保险解决方案来为汽车提供保障。
-
挑战越来越多地包括监管、法律和社会方面的考虑,例如运营许可证和人际交往的影响。
-
汽车制造商的计划正在推迟。例如,现代的Genesis G90 和起亚 EV9汽车预计将配备 3 级高速公路驾驶导航 (HDP) 功能。延迟是由于系统需要支持各种现实世界的驾驶场景。
-
尽管 4 级感知算法和用于移动用例的更广泛的自动驾驶系统(例如机器人出租车)不断改进,但无人驾驶运营并未迅速扩展到不同的城市。Cruise 在 2023 年发生的事故导致其战略发生变化,裁员近 25%。
用户建议
政府必须:
-
制定国家立法,确保自动驾驶汽车能够与传统汽车安全共存,并制定自动驾驶汽车的审批和注册框架。
-
与自动驾驶汽车开发商密切合作,确保急救人员能够安全地应对道路交通和其他紧急情况,并且自动驾驶汽车不会阻碍或妨碍活动。
自动驾驶移动运营商应该:
-
继续关注安全和无事故道路环境,增强消费者对自动驾驶汽车技术的信心。
希望在其车队中采用自动驾驶技术的传统车队运营商应该:
-
通过制定政策和计划来培训和调动这些员工到其他岗位,最大限度地减少对驾驶工作(公交车、出租车和卡车司机)的破坏性影响。
汽车制造商应该:
-
制定计划,将更高水平的自主性部署到正在设计和制造的车辆上,以确保未来的车辆购买,并实现未来的功能即服务收入流。
供应商:Aurora ;AutoX ;百度;Cruise ;Mobileye ;NVIDIA ;Oxa ;Pony.ai ;Waymo ;Zoox
27、知识图谱
影响力评级:较高
市场渗透率:目标受众的 5% 至 20%
成熟度:早期主流
定义:知识图谱是物理和数字世界的机器可读表示。它们包括实体(人员、公司和数字资产)及其关系,这些关系遵循图形数据模型——节点(顶点)和链接(边/弧)的网络。
为什么重要
知识图谱以直观的视觉格式捕获有关世界的信息,同时仍能够表示复杂的关系。知识图谱是许多产品的支柱,包括搜索、智能助手和推荐引擎。知识图谱支持协作和共享、探索和发现以及通过分析提取见解。生成式 AI 模型可以与知识图谱相结合,以提供更准确输出的背景,这种技术被称为 GraphRAG 或 G-RAG。
商业冲击
知识图谱可以在各种不同的环境中推动业务影响,包括:
-
数字化工作场所(如协作、共享和搜索)
-
自动化(例如从内容中提取数据到机器人过程自动化)
-
机器学习(例如增强训练数据)
-
调查分析(如执法、网络安全和风险管理)
-
数字商务(如产品信息管理和推荐)
-
数据管理(如元数据管理、数据编目和数据结构)
驱动因素
-
需要利用知识图谱提供的显性知识、规则和语义来补充仅检测数据中的模式(例如当前一代的基础模型)的人工智能和机器学习方法。
-
希望更好地利用文档、信函、图像和视频中保存的非结构化数据,使用可关联和管理的标准化元数据,并为 AI 就绪数据提供基础。
-
越来越多地使用具有大型语言模型 (LLM) 的知识图谱来在回答有关大量企业数据的问题时提供增强的上下文理解。
-
人们越来越意识到知识图谱在消费产品和服务中的应用,例如智能设备和语音助手、聊天机器人、搜索引擎、推荐引擎和路线规划。
-
Web3 应用程序的新兴前景和跨信任网络访问数据的需求,导致了去中心化知识图谱的创建,以构建不可变且可查询的数据结构。
-
需要管理日益增多的数据孤岛,其中的数据经常重复,且其含义、使用和消费模式也未明确定义。
-
使用图形算法和机器学习来识别复杂网络中的影响者、客户群、欺诈活动和关键瓶颈。
障碍
-
人们对知识图谱用例的认识正在不断提高,但在早期实施阶段很难捕捉到商业价值和相关性。
-
将知识图谱模型从原型转移到生产需要工程和系统集成专业知识。在知识图谱扩展过程中维护知识图谱的方法(以确保可靠的性能、处理重复和保持数据质量)仍不成熟。
-
图形 DBMS 市场在三个属性上呈现碎片化:数据模型类型(资源描述框架或属性)、实现架构(本机或多模式)和最佳工作负载(操作或分析)。这种碎片化继续导致采用者感到困惑和犹豫。
-
组织希望能够获取、验证和共享与实体(如地理、人物和事件)相关的本体和数据。然而,让内部数据与外部知识图谱互操作是一项挑战。
-
内部专业知识(尤其是主题专家)匮乏,而且很难找到第三方提供商。通常,专业知识掌握在图形技术供应商手中。可扩展性和优化方面的技能也很难获得。
用户建议
-
通过评估数据和分析 (D&A) 领导者、从业者和业务领域专家的技能,创建一个知识图谱从业者和赞助商工作组。应解决用例要求、数据特征、可扩展性预期、查询灵活性和知识图谱领域知识等因素。
-
运行试点以确定需要定制知识图谱的用例。试点不仅应为企业带来有形价值,还应为 D&A 员工带来学习和发展。
-
创建最小可行子集,以捕获业务领域的信息,从而缩短价值实现时间。评估知识图谱所需的结构化和非结构化数据,并遵循敏捷开发原则。
-
利用供应商和服务提供商的专业知识来验证用例、教育利益相关者并提供初步的知识图谱实施。
-
我将知识图谱纳入 D&A 治理和管理范围。为了避免数据孤岛的延续,研究并建立多个知识图谱进行互操作并向数据结构扩展的方法。
供应商:Cambridge Semantics; Diffbot;eccenca;Fluree;Neo4j;Ontotext;Stardog ;TigerGraph;TopQuadrant
28、智能应用
影响力评级:颠覆
市场渗透率:目标受众的 5% 至 20%
成熟度:早期主流
定义:智能应用程序利用学习适应能力自主响应人类和机器。虽然应用程序可以表现得非常智能,但智能应用程序本质上是智能/主动的。基于条件逻辑的规则方法正在让位于基于数学的训练,以便在各种情况下(包括新情况或独特情况)做出适当的响应。这使得在各种场景和用例中增强和自动化工作成为可能。
为什么重要
人工智能是当前企业应用的竞争焦点,许多技术提供商现在通过内置、添加、代理或自定义功能在其产品中启用人工智能。人工智能的最新发展继续使应用程序能够在更广泛的场景中自主工作,并提高质量和生产力。集成智能和人工智能还可以支持决策过程和交易过程。
商业冲击
企业购买或增强智能应用程序可获得以下三大好处:
-
自动化——它们提高自动化和动态决策能力,降低人工干预的成本和不可靠性,并提高业务流程的效率。
-
增强——它们可以提高基于上下文和风险的动态决策的速度和质量,无论是自动化的还是通过改进的决策支持。
-
情境化——应用程序可以适应用户或流程的情境,创造个性化的体验。
驱动因素
-
生成式人工智能和大型语言模型 (LLM) 的炒作浪潮,以及对话式用户界面 (UI)作为与它们交互方式的盛行,激发了创新,并揭示了在现有应用程序中添加人工智能功能的宝贵方法。现在可以通过自然语言提示更轻松地访问推荐、洞察和个性化等功能。展望未来,更广泛地整合基于聊天的界面将以一种易于组合的方式模糊界面和智能之间的界限。
-
AI 功能和特性越来越多地集成到企业应用程序套件中的 ERP、CRM、数字工作场所、供应链和知识管理软件中。嵌入式生成 AI(如上文 LLM 中所述)和传统 AI 功能(如预测分析)有助于从此类应用程序中的数据中获得更多见解。2023年 Gartner 企业 AI 调查显示,实现 GenAI 用例的最佳方式是将 GenAI 嵌入现有(购买)应用程序中。
-
组织要求应用程序(无论是自行开发还是购买)具有更多功能,希望它们能够通过建议、见解和附加信息来增强当前的交易和决策流程。这反过来又使供应商能够提供更高的价值并提高价格。
-
可组合业务架构的趋势凸显了提供先进而灵活的功能以支持、增强和自动化决策的可能性,而这些功能传统上需要构建底层数据结构和打包功能。然而,LLM 的日益普及有可能被用作可组合接口层,从而启动在可组合架构上交付的能力。
障碍
-
缺乏数据——智能应用程序需要访问来自一系列系统的数据,这意味着应用程序供应商需要考虑自己解决方案之外的数据管理技术和流程。
-
添加人工智能会增加运营的复杂性——必须训练和维护模型,用户必须了解正在使用哪些数据。情境化洞察需要业务元数据。
-
营销中过度使用人工智能——供应商有时会忽视对业务影响的关注,这可能会引起商业买家的愤世嫉俗的反应,特别是当人工智能过去没有带来价值时。
-
信任系统生成的见解——业务用户需要时间才能看到好处并信任这些见解,而一定的可解释性是关键。
用户建议
-
挑战套装软件提供商在其产品路线图和/或生态系统中概述他们如何融入人工智能,以一系列人工智能技术的形式增加商业价值。
-
评估提供商的架构时,请考虑到一流的智能应用程序都是从头开始构建的,以便不断从其他系统收集数据,并以数据结构的形式提供可靠的数据层。
-
优先投资以点解决方案形式提供的专业化和特定领域的智能应用程序,这有助于解决客户参与和服务、人才获取、协作和参与等领域的问题。
-
将 AI 组件引入可组合企业,以更快、更安全地进行创新,通过构建可重用性来降低成本,并为业务-IT 合作伙伴关系奠定基础。始终了解 AI 的不同之处,尤其是如何更新 ML 模型以避免实施和使用挑战。
供应商:Alkymi;ClayHR;Creatio;Eightfold AI;JAGGAER;OpenText;Prevedere;Salesforce;Sievo;SugarCRM
生产成熟期
29、计算机视觉
影响力评级:颠覆
市场渗透率:目标受众的20%至50%
成熟度:早期主流
定义:计算机视觉是一组技术,涉及捕获、处理和分析现实世界的图像和视频,以从物理世界中提取有意义的上下文信息。
为什么重要
计算机视觉 (CV)包括一系列变革性技术,包括 AI/生成式 AI、高级传感器和分析技术,这些技术对于感知和理解环境至关重要。计算机视觉技术正在推动许多行业和用例的创新,并正在创造前所未有的商业应用和机会。
商业冲击
CV 技术应用于所有行业,并解决日益广泛的业务应用。这些应用包括物理安全、医疗保健、零售、汽车、机器人、制造、供应链/物流、银行和金融、农业、政府以及媒体和娱乐。计算机视觉在可见和不可见光谱中运行,包括红外、高光谱成像、激光雷达、雷达和紫外线。
驱动因素
CV 的采用是由对自动化日益增长的需求推动的,以降低成本并提高监控和响应能力。其他驱动因素包括:
-
机器学习 (ML) 方法、工具和服务、硬件处理效率以及数据生成和增强技术的可用性和应用方面的改进。
-
使用大型语言模型 (LLM) 对 CV 进行多模态训练有助于对非结构化图像数据进行自然语言上下文搜索,并大规模关联视频流上的数据。
-
新的架构、模型和算法增强功能稳步提升了 CV 应用的性价比。卷积神经网络 (CNN) 和视觉转换器的组合提供了领先的性能水平。
-
Google Lumiere 和 OpenAI Sora 等图像和视频生成领域的进步在文本到视频生成的复杂性和真实性方面开辟了新的空间。
-
摄像头和其他传感器的普及导致图像数据呈指数级增长,对自动分析和管理数据并从中提取价值的方法的需求日益迫切。动态视觉系统现已集成到智能手机中,而低成本的激光雷达产品正在开辟新的创新领域。
-
通过近距离注意点渲染(PAPR)和3D 生成 AI的应用等新技术,可以实现现实世界物体和环境的3D 捕获、建模和编辑。
-
边缘支持框架、开发者生态系统、模型压缩和芯片进步。
-
新的商业模式和应用范围包括智能手机摄像头和滤镜、全球视频内容制作和分发、救生医学图像诊断、自动驾驶汽车、安全视频监控、机器人和制造自动化。
-
传感器融合、多光谱和高光谱成像扩大了应用范围。
-
更高的可靠性、价格、性能和功能可产生引人注目的商业价值。
-
使用 GenAI 的开放世界识别可以识别和分类已知物体,以及处理新环境中未知/看不见的物体类别和活动,而无需在特定示例上训练模型。
障碍
-
高端系统价格昂贵,并且构建具有足够投资回报率的商业案例具有挑战性。
-
CV 市场缺乏独立的标准化和性能基准/KPI,先进的解决方案远未商品化,可靠性仍然是自动驾驶汽车等关键任务应用的障碍。
-
由于缺乏开放接口,集成存在问题。
-
企业难以在业务流程中激活 CV 模型,并面临数据安全以及组织挑战和用户对视觉监控的抵制。
-
由于硬件成本以及高水平的定制和服务支持,扩展解决方案具有挑战性。
-
获取足够的训练数据可能很困难或者成本很高,特别是在可用的开源 CV 数据集正在减少的领域。
-
专有算法和专利池阻碍了创新。
-
道德、隐私和监管问题不断涌现,包括利用深度伪造技术进行贪污、误导性广告和勒索,以及捕获面部和其他生物特征数据和新简历技术对版权和真实性的影响。
用户建议
-
评估CV 项目对组织及其人员的变更管理影响。
-
最初关注几个小项目,使用快速失败方法,然后使用跨学科团队将最有前景的系统投入生产。
-
在真实环境中尽早测试生产系统,因为光照、颜色、物体布置和移动可能会破坏在开发周期中运行良好的 CV 解决方案。
-
建立内部 CV 能力和流程以利用图像和视频资产。
-
利用第三方 CV 工具和服务来加速数据准备并降低成本。
-
首先评估与 CV 项目相关的法律、监管、商业和声誉风险。
-
通过投资合成和增强数据解决方案以及模型压缩来提高模型性能并扩大更有价值的用例范围,解决两个主要挑战——缺乏训练数据以及昂贵且受限的硬件,从而降低 CV 采用的障碍。
供应商:AWS;Adobe、百度;Clarifa i;Dragonfruit AI ;Landing AI;Matroid;微软;Prophesee;腾讯