微软开源智能体治理工具包 AGT:控制智能体行为与成本,助力智能体领域成熟! 发布时间:2026/6/25 20:12:45 【微软推出智能体治理工具包 AGT】随着智能体 AI 的迅速普及这些非确定性的助手暴露出了一系列问题。这主要是因为 AI 智能体并非人类即便它们通常使用与人类相同的 API行为却大相径庭。例如在构建回复所需的上下文时智能体发起的查询数量远超人类。有与智能体合作过的公司或是有用户通过智能体访问服务的公司提供的轶事数据表明这可能会导致 API 使用量大幅增加进而影响服务的可用性。这种增长是由于自动化请求大量涌入阻塞了 API 的调用和响应。这些 API 在一年前还能正常工作但如今却难以应对如此大的负载。虽然对 API 进行根本性的重新设计势在必行但预算、资源和能力等因素使得这一目标难以一蹴而就。因此需要一种方法来管理智能体与 API 的交互将智能体视为一类新用户制定并执行管理智能体生命周期所需的策略。使用模型上下文协议Model Context ProtocolMCP作为智能体访问 API 的标准包装器有助于实现这一点因为它为我们提供了一个通用环境可在其中实现控制智能体所需的治理层。微软最近推出了其开源智能体治理工具包Agent Governance ToolkitAGT的公开预览版旨在为智能体提供基于策略的执行机制确保在发起调用前对其进行评估。可以将该工具包视为管理智能体行为的一种方式而非控制智能体所使用的大语言模型Large Language ModelsLLMs的输入和输出。微软的数据显示这种保护智能体的方法比依赖提示规则要安全得多。不过在实践中将像 AGT 这样的功能工具与传统过滤器结合使用是个不错的选择这样可以捕捉用户错误和基于提示的攻击。【AGT 的特点与工作原理】AGT 是一套旨在应对开放 Web 应用安全项目Open Web Application Security ProjectOWASP列出的智能体风险的工具它基于微软保护自身智能体和 AI 平台的经验构建工具包中内置了超过 13000 项测试。其工作原理是在执行操作前对其进行评估根据策略进行检查然后决定是否允许该操作并记录结果。微软预计每次操作的策略评估时间少于 0.1 毫秒将开销降至最低。【智能体策略】OWASP 列出的十大智能体风险涵盖了因用户提示和不良应用设计而可能干扰智能体运行的重大问题包括智能体目标劫持、不受控制的代码执行、不安全的输出处理以及智能体失控等。工具包中的功能旨在通过隔离和沙箱技术以及使用内容策略验证输出保护智能体应用免受这些问题的影响。可以使用声明式编程技术来制定定义智能体操作范围的策略。由于这些策略具有可读性可以与同事共享并在不同项目中对其进行优化从而为组织内运行的所有智能体制定一套通用的 AGT 规则。由此产生的授权模型是基于意图的智能体声明其意图AGT 会对其进行批准或拒绝。策略随后会确定允许的操作是允许并发出警报还是直接阻止。这种方法使代码能够检查编排操作是否偏离了顶层意图。当代码为多个并行智能体运行一个管理框架时这有助于确保应用按计划进行降低不必要操作和过度使用令牌的风险。智能体的行为往往会导致令牌使用量超出预期因此控制成本也是 AGT 的一项重要功能。随着平台转向新的定价和预算模式控制智能体交互中令牌使用量的能力将变得至关重要。通过在 AGT 策略中设置令牌预算开发人员可以防止用户产生意外的高额费用。AGT 的预算管理工具可以在智能体接近预设限制时限制其活动并在可能使用过多令牌时拒绝操作。【实时监控和管理智能体】甚至可以使用 AGT 来管理 API 调用这一点变得越来越重要因为智能体的上下文搜索活动可能会迅速使为人类交互设计的 API 不堪重负。通过制定规则限制在一定时间内的调用次数可以让智能体框架为管理限流而无需实施复杂的 API 管理工具。AGT 的一个关键特性是能够利用其声明式策略组合找出偏离设定基线的智能体有助于在问题造成损失或影响运营之前发现问题。必要时AGT 还可以启用终止开关。其日志记录和可观测性功能包括对问题进行根本原因分析以及微软所称的 决策物料清单它通过审计链跟踪治理决策并记录与智能体相关的信任级别细节。像 AGT 这样的工具包需要保持供应商中立因为智能体可能在任何环境中与模型协同工作。AGT 设计为可与 Azure Foundry、亚马逊 Bedrock 和谷歌 ADK 以及大多数常见的智能体编排框架配合使用。它支持五种不同的编程语言Python、TypeScript、.NET、Rust 和 Go。虽然不同实现的功能有所差异但 Python 版本具备完整的功能集。微软在 AGT 中做出了一些有趣的架构决策。其中最重要的一点是它将智能体视为在安全操作系统上运行的代码利用虚拟机管理程序的概念将智能体与底层平台隔离开来。从底层组件和包的命名方式中可以看出这一点核心治理包被称为 Agent OS。【将 AGT 集成到代码中】使用 AGT 入门非常简单可以使用所选语言的标准包管理器安装完整的工具包。当然也不必安装整个工具包。如果不需要所有功能或者只想使用单个功能可以选择安装特定的包。例如当想对智能体进行混沌测试时只需下载 AGT 的软件可靠性工程工具。可以在代码中定义策略也可以将其作为外部策略文档。策略主要关注关键的安全和治理目标例如阻止危险工具运行、在消息中查找个人身份信息Personally Identifiable InformationPII以及向用户展示采取的操作及其原因。对于生产环境中的 AGT 实现建议使用外部策略文档因为它们允许用 YAML 编写策略。工具包提供了一个单一的调用可以加载目录中的所有策略文件因此最好只在该位置存储生产策略以避免出现问题。在现有代码中添加对 AGT 的支持只需在智能体框架发起调用之前添加评估即可。这可以通过编辑器中的重构工具来完成找到调用并将评估器和决策结果包装在其周围。这样可以在不使用 AGT 的情况下开发智能体在确定智能体能够正常工作后再添加其工具。微软为 19 种不同的框架提供了定制适配器以确保它们能与之兼容。这些适配器可以与工具包的其他部分一起加载。AGT 标志着智能体领域的日益成熟它将企业级的严谨性引入了这个曾经混乱无序的领域。它解决了大规模使用智能体时的诸多担忧有助于控制智能体的行为和成本。自主软件需要受到约束而 AGT 的声明式策略构建和应用方法以及其整套工具使能够快速构建并应用必要的控制措施。随着企业希望控制成本监管机构希望确保智能体软件符合合规要求像智能体治理工具包这样的工具很可能会成为现代智能体开发环境中不可或缺的一部分。那么未来 AGT 还会给智能体领域带来哪些惊喜呢 相关新闻 UniXcoder技术深度解析:统一跨模态代码表示预训练架构设计与实战指南 UniXcoder技术深度解析:统一跨模态代码表示预训练架构设计与实战指南 【免费下载链接】CodeBERT CodeBERT 项目地址: https://gitcode.com/gh_mirrors/co/CodeBERT UniXcoder作为微软CodeBERT系列中的统一跨模态代码表示预训练模型,代表了当前代码… 2026/6/24 3:17:39 天若OCR开源版:零基础3分钟掌握高效离线文字识别 天若OCR开源版:零基础3分钟掌握高效离线文字识别 【免费下载链接】wangfreexx-tianruoocr-cl-paddle 天若ocr开源版本的本地版,采用Chinese-lite和paddleocr识别框架 项目地址: https://gitcode.com/gh_mirrors/wa/wangfreexx-tianruoocr-cl-paddle … 2026/6/23 23:40:40 AI生成React组件在真实项目中的局限与高效集成策略 1. 项目概述:当AI组件生成器撞上现实最近两年,前端圈子里冒出来不少AI驱动的React组件生成工具,从简单的代码片段补全,到号称能根据设计稿或自然语言描述直接生成完整可用的组件。一开始,大家觉得这简直是生产力神器&a… 2026/6/23 18:26:46 最新新闻 千问新用户福利怎么领,附亲测有效的最新口令:千问新用户专属853226 现在的AI也太强大了,什么都能干,随便聊上几句就能帮你点奶茶、打车。想要优惠券,它就能给你整来8元通用立减券,千问真是一个懂你的APP。但是这不是每个人都能得到的,需要满足两个条件,一个是新用户… 2026/6/25 19:22:57 基于多算法融合的图像去重系统ImageDedup技术解析 基于多算法融合的图像去重系统ImageDedup技术解析 【免费下载链接】imagededup 😎 Finding duplicate images made easy! 项目地址: https://gitcode.com/gh_mirrors/im/imagededup ImageDedup是一个专业的Python图像去重库,通过集成感知哈希算法… 2026/6/25 19:22:57 视觉指令微调实战:工业质检场景下的多模态模型精准训练 1. 项目概述:这不是“多模态大模型科普”,而是一次实操级的视觉指令微调拆解如果你最近翻过arXiv、刷过Hugging Face Model Hub,或者只是在技术群里看到有人发“LLaVA-1.5效果炸裂”“Qwen-VL支持中文视觉问答”,那你大概率已经撞… 2026/6/25 19:22:57 生成式AI在软件开发中的人机协同实践指南 1. 这不是“AI取代程序员”的恐吓片,而是一份写给一线开发者的实操观察手记 “Generative AI”这个词最近三年在技术社区里被反复咀嚼、加热、再冷却,最后端上桌时,常常裹着两层截然不同的糖衣:一层是投资人PPT里“降本增效300%”… 2026/6/25 19:22:57 电脑文件不小心删了怎么恢复?7种高分恢复技巧(2026年全新) 写了一周的项目方案,前一秒还在电脑里,下一秒就彻底找不到,电脑文件不小心删了怎么恢复?这一阶段千万要稳住,因为反复新建文件、下载软件覆盖磁盘,很容易直接把数据彻底锁死,再也找不回来。不用… 2026/6/25 19:22:57 融合CV与密码学:构建自适应GUI自动化测试新范式 1. 项目概述:当GUI测试遇见CV与密码学做自动化测试的朋友,尤其是搞UI/GUI自动化的,这几年估计都挺头疼。传统的基于元素定位的框架,像Selenium、Appium,在应对现代复杂、动态、甚至带点“花活”的界面时,越… 2026/6/25 19:16:12 日新闻 OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49 决策树可解释性实战:三层探针系统构建业务可理解的AI决策 1. 项目概述:当决策树不再“透明”,我们该如何真正看清它?决策树分类器常被称作机器学习里的“白盒模型”——结构清晰、分支可追溯、预测路径一目了然。但现实远比教科书复杂:一棵深度为12、节点数超3000的树,用graph… 2026/6/25 12:22:52 Java八股-线程池与并发为什么总出问题 Java八股:线程池与并发为什么总出问题 文章目录Java八股:线程池与并发为什么总出问题先说结论线程池到底解决什么线程池为什么会出问题一个线程池的执行过程为什么锁总是和并发题一起出现面试最常问的几个点实战里怎么设计更稳一个更稳的回答模板结尾先说… 2026/6/25 12:22:52 周新闻 第四章:本体推理的技术基础设施 当LLM不够用了——本体推理的企业决策实践第三章讲了"怎么落地"的方法论。这一章聚焦在"落地靠什么"——推理的技术基础设施。 如果说前三章是在论证"为什么要做本体推理"和"怎么做才能不失败",那么从这一章开始࿰… 2026/6/24 17:34:30 OpenClaw:本地AI工作流的可编程调度中枢 1. OpenClaw不是“另一个前端界面”,而是本地AI工作流的中枢调度器很多人第一次看到 OpenClaw,下意识会把它当成 ComfyUI 或 Ollama Web UI 那类图形化前端——点几下就能调模型、聊聊天。我最初也这么想,直到在 Ubuntu 24.04.4 的移动硬盘虚… 2026/6/24 17:34:33 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 【免费下载链接】Deceive 🎩 Appear offline for League of Legends, VALORANT, and Legends of Runeterra. 项目地址: https://gitcode.com/gh_mirrors/de/Deceive 你是否曾因为登录游戏就被… 2026/6/24 17:34:35 月新闻 仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/25 5:32:38 【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/25 3:47:27 Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/25 9:51:33
UniXcoder技术深度解析:统一跨模态代码表示预训练架构设计与实战指南 UniXcoder技术深度解析:统一跨模态代码表示预训练架构设计与实战指南 【免费下载链接】CodeBERT CodeBERT 项目地址: https://gitcode.com/gh_mirrors/co/CodeBERT UniXcoder作为微软CodeBERT系列中的统一跨模态代码表示预训练模型,代表了当前代码… 2026/6/24 3:17:39
天若OCR开源版:零基础3分钟掌握高效离线文字识别 天若OCR开源版:零基础3分钟掌握高效离线文字识别 【免费下载链接】wangfreexx-tianruoocr-cl-paddle 天若ocr开源版本的本地版,采用Chinese-lite和paddleocr识别框架 项目地址: https://gitcode.com/gh_mirrors/wa/wangfreexx-tianruoocr-cl-paddle … 2026/6/23 23:40:40
AI生成React组件在真实项目中的局限与高效集成策略 1. 项目概述:当AI组件生成器撞上现实最近两年,前端圈子里冒出来不少AI驱动的React组件生成工具,从简单的代码片段补全,到号称能根据设计稿或自然语言描述直接生成完整可用的组件。一开始,大家觉得这简直是生产力神器&a… 2026/6/23 18:26:46
千问新用户福利怎么领,附亲测有效的最新口令:千问新用户专属853226 现在的AI也太强大了,什么都能干,随便聊上几句就能帮你点奶茶、打车。想要优惠券,它就能给你整来8元通用立减券,千问真是一个懂你的APP。但是这不是每个人都能得到的,需要满足两个条件,一个是新用户… 2026/6/25 19:22:57
基于多算法融合的图像去重系统ImageDedup技术解析 基于多算法融合的图像去重系统ImageDedup技术解析 【免费下载链接】imagededup 😎 Finding duplicate images made easy! 项目地址: https://gitcode.com/gh_mirrors/im/imagededup ImageDedup是一个专业的Python图像去重库,通过集成感知哈希算法… 2026/6/25 19:22:57
视觉指令微调实战:工业质检场景下的多模态模型精准训练 1. 项目概述:这不是“多模态大模型科普”,而是一次实操级的视觉指令微调拆解如果你最近翻过arXiv、刷过Hugging Face Model Hub,或者只是在技术群里看到有人发“LLaVA-1.5效果炸裂”“Qwen-VL支持中文视觉问答”,那你大概率已经撞… 2026/6/25 19:22:57
生成式AI在软件开发中的人机协同实践指南 1. 这不是“AI取代程序员”的恐吓片,而是一份写给一线开发者的实操观察手记 “Generative AI”这个词最近三年在技术社区里被反复咀嚼、加热、再冷却,最后端上桌时,常常裹着两层截然不同的糖衣:一层是投资人PPT里“降本增效300%”… 2026/6/25 19:22:57
电脑文件不小心删了怎么恢复?7种高分恢复技巧(2026年全新) 写了一周的项目方案,前一秒还在电脑里,下一秒就彻底找不到,电脑文件不小心删了怎么恢复?这一阶段千万要稳住,因为反复新建文件、下载软件覆盖磁盘,很容易直接把数据彻底锁死,再也找不回来。不用… 2026/6/25 19:22:57
融合CV与密码学:构建自适应GUI自动化测试新范式 1. 项目概述:当GUI测试遇见CV与密码学做自动化测试的朋友,尤其是搞UI/GUI自动化的,这几年估计都挺头疼。传统的基于元素定位的框架,像Selenium、Appium,在应对现代复杂、动态、甚至带点“花活”的界面时,越… 2026/6/25 19:16:12
OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49
决策树可解释性实战:三层探针系统构建业务可理解的AI决策 1. 项目概述:当决策树不再“透明”,我们该如何真正看清它?决策树分类器常被称作机器学习里的“白盒模型”——结构清晰、分支可追溯、预测路径一目了然。但现实远比教科书复杂:一棵深度为12、节点数超3000的树,用graph… 2026/6/25 12:22:52
Java八股-线程池与并发为什么总出问题 Java八股:线程池与并发为什么总出问题 文章目录Java八股:线程池与并发为什么总出问题先说结论线程池到底解决什么线程池为什么会出问题一个线程池的执行过程为什么锁总是和并发题一起出现面试最常问的几个点实战里怎么设计更稳一个更稳的回答模板结尾先说… 2026/6/25 12:22:52
第四章:本体推理的技术基础设施 当LLM不够用了——本体推理的企业决策实践第三章讲了"怎么落地"的方法论。这一章聚焦在"落地靠什么"——推理的技术基础设施。 如果说前三章是在论证"为什么要做本体推理"和"怎么做才能不失败",那么从这一章开始࿰… 2026/6/24 17:34:30
OpenClaw:本地AI工作流的可编程调度中枢 1. OpenClaw不是“另一个前端界面”,而是本地AI工作流的中枢调度器很多人第一次看到 OpenClaw,下意识会把它当成 ComfyUI 或 Ollama Web UI 那类图形化前端——点几下就能调模型、聊聊天。我最初也这么想,直到在 Ubuntu 24.04.4 的移动硬盘虚… 2026/6/24 17:34:33
3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 【免费下载链接】Deceive 🎩 Appear offline for League of Legends, VALORANT, and Legends of Runeterra. 项目地址: https://gitcode.com/gh_mirrors/de/Deceive 你是否曾因为登录游戏就被… 2026/6/24 17:34:35
仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/25 5:32:38
【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/25 3:47:27
Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/25 9:51:33