每日一个开源项目(第120篇):SkillLens - 微软出品,照亮 AI Agent 技能生命周期的“显微镜” 发布时间:2026/6/25 1:18:26 引言“不仅要让 Agent 拥有技能更要弄清楚技能是如何被模型‘吸收’的。”这是一天一个开源项目系列的第120篇文章。今天我们要介绍的是微软推出的SkillLens。如果说前两天介绍的 SkillOpt 是一套提升 AI 技能的执行策略那么SkillLens就是研究这些技能演化过程的“显微镜”。它提供了一个科学的分析框架帮助研究者和开发者理解一个由 AI 自己总结出来的技能究竟是怎么影响另一个 AI 的执行效率的你将学到什么Agent 技能的全生命周期经验 → 提取 → 消费核心指标提取效能Extraction Efficacy与目标进化能力Target Evolvability如何在五个主流 Agent 基准测试中验证技能的有效性项目背景项目简介SkillLens 是微软研究院的一个开源框架专门用于系统性地研究“模型生成的 Agent 技能”。它提供了一套完整的流水线Pipeline涵盖了从轨迹加载、技能提取到推理验证的各个环节。该项目在 GitHub 上随同论文《From Raw Experience to Skill Consumption》发布是目前 Agent 技能研究领域最权威的工具之一。核心价值全生命周期覆盖不仅关注技能长什么样提取阶段更关注技能怎么来经验阶段以及怎么用消费阶段。多方法对比内置了两种技能提取方法——单次处理的sequential顺序提取和多轨迹并行提取并分层合并的parallel并行提取。权威测评集支持 SWE-bench、ALFWorld、SpreadsheetBench 等五个主流的 Agent 性能基准测试。主要功能1. 统一的轨迹转换 (Schema Normalization)将来自不同基准测试如复杂的 SWE-bench 调试记录或简单的 ALFWorld 游戏日志的原始运行轨迹转换为统一的 JSON Schema让后续的批量技能提取成为可能。2. 分层合并提取 (Hierarchical Merge Extraction)SkillLens 的核心技术之一是其并行提取方法。它会分析每一条成功或失败的轨迹提取出独立的 Mode最后通过分层合并算法生成高概括性的skill_set.json。3. 一体化推理 CLI通过简单的skilllens infer命令开发者可以一键对比“有技能注入”和“无技能注入”情况下 Agent 的成功率差异。项目剖析四阶段研究流水线 (4-Stage Pipeline)SkillLens 将每一次实验都标准化为四个阶段Raw Experience Generation让 Agent 在基准测试中跑出原始轨迹。Schema Normalization将原始输出标准化。Skill Extraction将经验池Experience Pool提炼为技能集。Skill Consumption将提取出的技能注入目标模型重新测试性能增益。这种严谨的科研流程对于那些希望在其产品中集成“自我进化”功能的开发者来说具有极高的参考价值。项目地址与资源官方资源GitHub: microsoft/SkillLens学术论文: arXiv:2605.23899项目主页: microsoft.github.io/SkillLens总结如果说 SkillOpt 告诉我们“怎么做”那么 SkillLens 则是在解释“为什么”。作为微软 Agent 研究生态的重要组成部分SkillLens 为我们揭示了 AI 从自身经验中学习并转化成可执行知识的深层机理。对于追求卓越性能的 Agent 开发者而言SkillLens 提供的实证评估方法是不可或缺的导航灯塔。欢迎来我的个人主页找到更多有用的知识和有趣的产品 相关新闻 解决老旧Mac系统升级难题的OpenCore Legacy Patcher实战指南 解决老旧Mac系统升级难题的OpenCore Legacy Patcher实战指南 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher OpenCore Legacy Patcher(OCLP&#… 2026/6/25 1:17:51 h2ogpt-oasst1-512-12b模型架构深度剖析:从GPTNeoX到NPU支持的完整指南 [特殊字符] h2ogpt-oasst1-512-12b模型架构深度剖析:从GPTNeoX到NPU支持的完整指南 🚀 【免费下载链接】h2ogpt-oasst1-512-12b 项目地址: https://ai.gitcode.com/hf_mirrors/SY_AICC/h2ogpt-oasst1-512-12b h2ogpt-oasst1-512-12b是一个基于GPTNeoX架构的… 2026/6/23 17:03:23 如何快速上手Hy-MT2-1.8B:5分钟部署你的第一个翻译AI 如何快速上手Hy-MT2-1.8B:5分钟部署你的第一个翻译AI 【免费下载链接】Hy-MT2-1.8B 项目地址: https://ai.gitcode.com/tencent_hunyuan/Hy-MT2-1.8B Hy-MT2-1.8B是腾讯混元推出的轻量级翻译AI模型,专为快速部署和高效翻译任务设计。本文将带你通… 2026/6/24 6:59:52 最新新闻 OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49 SpringBoot中文乱码终极解决方案:JVM、Logback与VSCode终端编码对齐 1. 问题不是“显示异常”,而是终端编码与日志输出链路的双重失配 在 Windows 系统里用 VSCode 启动 SpringBoot 项目,控制台(Integrated Terminal)里 logback 打印的中文变成一堆问号、方块或乱码字符——这几乎是每个刚从 IDE… 2026/6/24 23:22:49 MPC862程序流追踪与硬件调试:从原理到实战解决嵌入式通信系统难题 1. MPC862程序流追踪:从硬件原理到实战调试在嵌入式通信系统的开发里,最让人头疼的莫过于程序“跑飞”了。你看着板子上的指示灯乱闪,串口输出一堆乱码,但就是不知道CPU到底执行了哪条指令、在哪个分支上出了问题。尤其是在像MPC8… 2026/6/24 23:22:49 基于Tor Hidden Service的匿名通信系统Ricochet架构深度解析 1. 项目概述:为什么我们需要一个“终极”匿名通信方案?在数字世界里,隐私和匿名性正变得越来越奢侈。我们每天使用的即时通讯工具,无论是微信、Telegram还是Signal,都在不同程度上依赖于中心化的服务器。这意味着&… 2026/6/24 23:22:49 多重冒号(::)在编程中的核心作用:从命名空间到代码组织 1. 项目概述:从“多重冒号”到代码的优雅表达最近在代码审查和开源项目里,我时不时会看到一个叫“Multiple-Colon”的讨论点。乍一看这个标题,你可能会有点懵:冒号不就是个标点吗,还能玩出什么花样?但如果你… 2026/6/24 23:22:49 LINPACK基准测试:从原理到实战,全面解析HPC性能评估金标准 1. 项目概述:从“超级计算机的标尺”到“无处不在的性能度量”如果你在服务器、高性能计算(HPC)甚至个人电脑的评测里,看到过“双精度浮点性能达到XX TFlops”这样的描述,那背后十有八九站着LINPACK的身影。LINPACK Be… 2026/6/24 23:22:49 日新闻 OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49 周新闻 第四章:本体推理的技术基础设施 当LLM不够用了——本体推理的企业决策实践第三章讲了"怎么落地"的方法论。这一章聚焦在"落地靠什么"——推理的技术基础设施。 如果说前三章是在论证"为什么要做本体推理"和"怎么做才能不失败",那么从这一章开始࿰… 2026/6/24 17:34:30 OpenClaw:本地AI工作流的可编程调度中枢 1. OpenClaw不是“另一个前端界面”,而是本地AI工作流的中枢调度器很多人第一次看到 OpenClaw,下意识会把它当成 ComfyUI 或 Ollama Web UI 那类图形化前端——点几下就能调模型、聊聊天。我最初也这么想,直到在 Ubuntu 24.04.4 的移动硬盘虚… 2026/6/24 17:34:33 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 【免费下载链接】Deceive 🎩 Appear offline for League of Legends, VALORANT, and Legends of Runeterra. 项目地址: https://gitcode.com/gh_mirrors/de/Deceive 你是否曾因为登录游戏就被… 2026/6/24 17:34:35 月新闻 仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/24 0:01:03 【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/24 0:01:03 Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/23 21:00:27
解决老旧Mac系统升级难题的OpenCore Legacy Patcher实战指南 解决老旧Mac系统升级难题的OpenCore Legacy Patcher实战指南 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher OpenCore Legacy Patcher(OCLP&#… 2026/6/25 1:17:51
h2ogpt-oasst1-512-12b模型架构深度剖析:从GPTNeoX到NPU支持的完整指南 [特殊字符] h2ogpt-oasst1-512-12b模型架构深度剖析:从GPTNeoX到NPU支持的完整指南 🚀 【免费下载链接】h2ogpt-oasst1-512-12b 项目地址: https://ai.gitcode.com/hf_mirrors/SY_AICC/h2ogpt-oasst1-512-12b h2ogpt-oasst1-512-12b是一个基于GPTNeoX架构的… 2026/6/23 17:03:23
如何快速上手Hy-MT2-1.8B:5分钟部署你的第一个翻译AI 如何快速上手Hy-MT2-1.8B:5分钟部署你的第一个翻译AI 【免费下载链接】Hy-MT2-1.8B 项目地址: https://ai.gitcode.com/tencent_hunyuan/Hy-MT2-1.8B Hy-MT2-1.8B是腾讯混元推出的轻量级翻译AI模型,专为快速部署和高效翻译任务设计。本文将带你通… 2026/6/24 6:59:52
OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49
SpringBoot中文乱码终极解决方案:JVM、Logback与VSCode终端编码对齐 1. 问题不是“显示异常”,而是终端编码与日志输出链路的双重失配 在 Windows 系统里用 VSCode 启动 SpringBoot 项目,控制台(Integrated Terminal)里 logback 打印的中文变成一堆问号、方块或乱码字符——这几乎是每个刚从 IDE… 2026/6/24 23:22:49
MPC862程序流追踪与硬件调试:从原理到实战解决嵌入式通信系统难题 1. MPC862程序流追踪:从硬件原理到实战调试在嵌入式通信系统的开发里,最让人头疼的莫过于程序“跑飞”了。你看着板子上的指示灯乱闪,串口输出一堆乱码,但就是不知道CPU到底执行了哪条指令、在哪个分支上出了问题。尤其是在像MPC8… 2026/6/24 23:22:49
基于Tor Hidden Service的匿名通信系统Ricochet架构深度解析 1. 项目概述:为什么我们需要一个“终极”匿名通信方案?在数字世界里,隐私和匿名性正变得越来越奢侈。我们每天使用的即时通讯工具,无论是微信、Telegram还是Signal,都在不同程度上依赖于中心化的服务器。这意味着&… 2026/6/24 23:22:49
多重冒号(::)在编程中的核心作用:从命名空间到代码组织 1. 项目概述:从“多重冒号”到代码的优雅表达最近在代码审查和开源项目里,我时不时会看到一个叫“Multiple-Colon”的讨论点。乍一看这个标题,你可能会有点懵:冒号不就是个标点吗,还能玩出什么花样?但如果你… 2026/6/24 23:22:49
LINPACK基准测试:从原理到实战,全面解析HPC性能评估金标准 1. 项目概述:从“超级计算机的标尺”到“无处不在的性能度量”如果你在服务器、高性能计算(HPC)甚至个人电脑的评测里,看到过“双精度浮点性能达到XX TFlops”这样的描述,那背后十有八九站着LINPACK的身影。LINPACK Be… 2026/6/24 23:22:49
OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49
第四章:本体推理的技术基础设施 当LLM不够用了——本体推理的企业决策实践第三章讲了"怎么落地"的方法论。这一章聚焦在"落地靠什么"——推理的技术基础设施。 如果说前三章是在论证"为什么要做本体推理"和"怎么做才能不失败",那么从这一章开始࿰… 2026/6/24 17:34:30
OpenClaw:本地AI工作流的可编程调度中枢 1. OpenClaw不是“另一个前端界面”,而是本地AI工作流的中枢调度器很多人第一次看到 OpenClaw,下意识会把它当成 ComfyUI 或 Ollama Web UI 那类图形化前端——点几下就能调模型、聊聊天。我最初也这么想,直到在 Ubuntu 24.04.4 的移动硬盘虚… 2026/6/24 17:34:33
3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 【免费下载链接】Deceive 🎩 Appear offline for League of Legends, VALORANT, and Legends of Runeterra. 项目地址: https://gitcode.com/gh_mirrors/de/Deceive 你是否曾因为登录游戏就被… 2026/6/24 17:34:35
仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/24 0:01:03
【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/24 0:01:03
Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/23 21:00:27