这包括利用默认安全的基础架构防护功能,以及过去二十年中积累的专业知识来保护 AI 系统、应用和用户。同时,培养组织专业知识,以与 AI 技术的发展保持一致,并开始在 AI 和不断变化的威胁模型的情况下扩缩和调整基础架构保护措施。例如,SQL 注入等注入技术已经存在一段时间,组织可以调整缓解措施(例如输入排错和限制)来帮助更好地防范即时注入式攻击。
2. 扩大检测和响应范围,将 AI 技术融入组织的威胁宇宙
及时性对于检测和响应 AI 相关的网络突发事件至关重要,并将威胁情报和其他功能扩展到组织可以提高两者。对于组织,这包括监控生成式 AI 系统的输入和输出以检测异常情况,并使用威胁情报来预测攻击。这项工作通常需要与信任和安全团队、威胁情报和反滥用团队协作。
跨控制框架的一致性可支持 AI 风险缓解和跨不同平台和工具的规模保护,以确保以可扩展且具有成本效益的方式为所有 AI 应用提供最佳保护。在 Google,这包括将默认的安全保护扩展到 Vertex AI 和 Security AI Workbench 等 AI 平台,并将控制和保护措施内置到软件开发生命周期中。涉及通用用例的功能(如 Perspective API)可以帮助整个组织受益于先进的保护功能。
5. 调整控件以调整缓解措施,并为 AI 部署创建更快的反馈循环
通过持续学习持续测试实现,可以确保检测和保护功能可以应对不断变化的威胁环境。这包括基于突发事件和用户反馈的强化学习等技术,包括更新训练数据集、微调模型以从战略上应对攻击,以及允许构建模型以进一步在上下文中嵌入安全性(例如检测异常行为)等步骤。组织还可以定期开展红色团队培训,以提高 AI 产品和产品的安全保障。
6. 将 AI 系统风险置于周围的业务流程中
最后,与组织将如何部署 AI 相关的端到端风险评估有助于做出明智决策。这包括评估端到端业务风险,例如针对特定类型的应用的数据沿袭、验证和运营行为监控。此外,组织还应构建自动检查来验证 AI 性能。
其他资源
有关实现 SAIF 的从业者指南。本指南将介绍一些实用的实践知识,让您了解组织可如何着手将 SAIF 方法应用于现有或新的 AI 技术。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2023-07-27。"],[[["\u003cp\u003eThe Secure AI Framework (SAIF) is designed to mitigate risks associated with AI systems, such as model stealing, data poisoning, and prompt injection.\u003c/p\u003e\n"],["\u003cp\u003eSAIF emphasizes strong security foundations, extending detection and response capabilities to encompass AI threats, and automating defenses to counter evolving risks.\u003c/p\u003e\n"],["\u003cp\u003eOrganizations should harmonize platform-level controls for consistent security, adapt controls through continuous learning, and contextualize AI system risks within their business processes.\u003c/p\u003e\n"],["\u003cp\u003eGoogle provides resources like a practitioner's guide and a report on red teaming for AI systems to assist in implementing SAIF effectively.\u003c/p\u003e\n"]]],[],null,[]]