re:Invent 2023 | 使用Amazon Bedrock的Guardrails,轻松构建安全可靠的AI应用

关键字: [Amazon Web Services re:Invent 2023, Amazon Bedrock Guardrails, Guardrails, Agents, Bedrock, Policies, Filtering]

本文字数: 1300, 阅读完需: 6 分钟

视频

如视频不能正常播放，请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV1Mc411D7nw

导读

Amazon Bedrock的防护栏可帮助组织根据其特定应用需求和负责任的AI政策来管理最终用户体验。您可以通过生成式AI应用提供一致安全的用户体验,无论底层基础模型如何。了解这一新功能如何让您能够定义自定义策略并管理用户与基础模型之间的交互,方法是过滤掉不允许的主题和有害内容。最后,观看演示了解如何使用Amazon Bedrock的基础模型和代理创建和应用定制的防护栏,在您的生成式AI应用中实施负责任的AI政策。

演讲精华

以下是小编为您整理的本次演讲的精华，共1000字，阅读时间大约是5分钟。如果您想进一步了解演讲内容或者观看演讲全文，请观看演讲完整视频或者下面的演讲原文。

亚马逊Bedrock的高级产品经理Harshal Palate在2022年re:Invent期间主持了一场会议。他表示，这次会议非常令人兴奋，因为有很多关于生成性AI和亚马逊Bedrock的讨论。在深入探讨Bedrock上护栏的主要话题之前，Harshal简要回顾了一下亚马逊最近推出的一些不同产品。他强调，通过Bedrock，亚马逊旨在为客户提供与模型相关的灵活性和选择，包括第三方模型以及亚马逊自己的Titan模型。"

"为了帮助客户选择适合其使用情况的正确模型，亚马逊在本周早些时候在Bedrock上引入了模型评估功能。Harshal还强调了自定义模型的新功能，包括微调、持续预训练和检索增强生成(RAG)。此外，集成层，即Bedrock上的Agents，可以通过将模型集成到应用程序中来自动执行多步任务。"

"Harshal解释说，提供所有这些选项——模型选择、定制和集成——需要强大的安全和隐私保护，以便它们可以用于任务关键的负载。这就是Guardrails出现的背景。Guardrails允许客户根据公司策略和内容过滤偏好来引导基础模型和最终用户之间的交互。"

"在接下来的会议中，我们将深入研究Guardrails，包括演示。Harshal介绍了负责Guardrails的产品方面的Anu Mishra，她将分享更多详细信息。他们还提到，会议结束时将有时间进行问答。"

"Anu开始强调了一些常见的使用案例和挑战，这些挑战是在构建由生成性模型驱动的负责任的人工智能应用时遇到的。使用案例横跨各行各业和职能，从聊天机器人到文档搜索和摘要。然而，存在着不想要的或无关的议题、毒性、隐私和偏见的风险。尽管基础模型中有内置的保护措施，但这些措施是模型特定的。为了开发符合组织政策的使用多个模型的应用，需要定制的保障措施。这就是Guardrails试图解决的问题。

防护栏系统通过对用户输入提示和基础模型的输出响应实施四种策略定制化的安全保障，包括拒绝主题、内容过滤、PII减少和词汇过滤。这些策略与预设的防护栏政策进行对比，并在需要时进行覆盖。

第一种策略是拒绝主题，允许限制某些话题的讨论，例如银行助理提供的投资建议。定义拒绝主题的过程包括提供名称、描述以及可选的例子短语。Anu展示了一个仅包含描述但无示例短语的“投资建议”拒绝主题的定义过程。

其次是内容过滤，针对四大类别：仇恨、侮辱、性和暴力。阈值可以根据需要进行调节，以实现不同程度的过滤。用户输入和模型响应均可设置单独的配置。Anu展示了如何为提示和响应设置高过滤级别的内容过滤。

词汇过滤允许阻止或屏蔽特定词汇，如竞争对手名称或污言秽语。预定义的污言秽语过滤器也可轻松启用。

PII减少允许阻止或编辑个人可识别信息，以在使用敏感数据时保护用户隐私并遵循相关政策。Anu提到PII减少功能即将推出。

Guardrails可在部署前创建并测试不同的基础模型。违规情况将在CloudWatch中进行记录，以便进行监控和分析。这将有助于对重复使用违反政策内容的用户采取纠正措施。

随后，Anu在Bedrock控制台中提供了一个创建“银行助理”Guardrail的演示。她定义了一个涵盖此范围的“投资建议”拒绝主题的描述。同时添加了过滤不同类型毒性的内容过滤。还为违规情况定义了批准的信息。

通过使用样本输入提示测试该Guardrail，以确保其如预期地对投资建议和毒性进行标记。控制台提供了详细的跟踪，以查看具体违反了哪些政策。Anu还展示了如何使用CloudWatch日志捕获完整的跟踪负载，以监控Guardrail的性能。

哈沙尔继续探讨了如何将安全边界应用于Bedrock平台的代理。这些代理能够通过链接思考提示并调用API和数据源来自动执行复杂任务。整个代理都可以配置一个安全边界，以确保对话仅涉及授权的主题和内容。

他以一个保险索赔处理代理为例进行了说明。开发者可以创建一个专注于保险业务的安全边界，从而排除任何不涉及保险的金融投资建议。

在创建代理时，配置安全边界的步骤与之前相同——定义禁止的话题、内容过滤器等等。如今，在创建代理的工作流程中，还需要添加应用一个或多个安全边界的额外步骤。

哈沙尔随后展示了一个创建保险索赔代理的过程。他展示了如何选择银行保险业务的安全边界，以及如何指定诸如401k建议等禁止话题。这样一来，代理就只能提供与保险索赔处理相关的建议。

总之，安全边界使得Bedrock平台上的开发人员能够构建负责任和符合法规的AI应用程序。通过将互动与公司政策保持一致，可以降低关于意外话题、毒性、隐私和公平性等方面的风险。与代理的集成允许自动化工作流程，同时通过安全边界保持对代理的控制。提供的预览功能提供了可定制的强大工具，引导生成模型朝着安全且有用的结果发展。

哈沙尔最后表示他们将会回答与会者的问题。这次会议强调了如何通过将生成模型与公司价值观和用户保护相结合，解决构建适合企业的AI应用程序的关键挑战。

下面是一些演讲现场的精彩瞬间：

亚马逊云科技的领导层概述了他们最近的宣布内容和在持续发展的云计算架构中如何实施安全保护措施。

他们强调，在利用多种基本模型构建创造性AI应用程序的过程中，需要采用定制且一致的安全策略。

为此，他们已经推出了一系列针对Amazon Bedrock的安全防护措施，以满足特定使用场景和公司政策的需求。

开发人员甚至可以创建一个名为投资建议的自定义拒绝主题，以防止虚拟助手提供投资建议。

此外，还提供了高度的内容过滤功能，以减少有害内容的传播。

领导层目前正在解释如何在Amazon Connect中创建代理。

总结

视频详细介绍了Amazon Bedrock的一项创新功能：Guardrails。开发者可以利用Guardrails根据公司政策来自动定制和保护与AI的互动。Guardrails通过四大可调整策略（包括拒绝敏感话题、内容审查、个人信息减少和词汇限制）来实现保护。这些策略可以应用于用户输入提示以及AI模型生成的回应。一旦违反某项策略，AI的回应将被预设的批准消息所替换。

视频中以一个虚构的银行助手聊天机器人为例，展示了如何创建Guardrails以防止不适宜的话题并过滤有害内容。它还演示了如何通过提供示例输入以及在启用和禁用Guardrails的情况下检测AI回应来测试Guardrails的功能。此外，Guardrails的跟踪数据还可以导出至CloudWatch日志，以便进行监控和分析。

视频还解释了如何将Guardrails应用于Bedrock代理，这些代理负责自动化多阶段工作流程。代理结合提示、API操作和数据源。在代理上应用Guardrails可以根据预设策略引导其对话过程，同时掩盖违反这些策略的回应。

演讲原文

https://blog.csdn.net/just2gooo/article/details/134837398

想了解更多精彩完整内容吗？立即访问re:Invent 官网中文网站！

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处，一键获取亚马逊云科技全球最新产品/服务资讯！

点击此处，一键获取亚马逊云科技中国区最新产品/服务资讯！

即刻注册亚马逊云科技账户，开启云端之旅！

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁？

亚马逊云科技（Amazon Web Services）是全球云计算的开创者和引领者，自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务，涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体，以及应用开发、部署与管理等方面；基础设施遍及 31 个地理区域的 99 个可用区，并计划新建 4 个区域和 12 个可用区。全球数百万客户，从初创公司、中小企业，到大型企业和政府机构都信赖亚马逊云科技，通过亚马逊云科技的服务强化其基础设施，提高敏捷性，降低成本，加快创新，提升竞争力，实现业务成长和成功。