Harness 马具/驾驭系统 发布时间:2026/6/10 13:18:21 在 AI Agent / LLM 领域看到的Agent Harness执行套件 / 驾驭层是借用了软件测试中test harness的概念专指包裹在大模型外围、让模型真正变成可用 Agent 的全部工程基础设施。核心理解Agent Model HarnessModelLLM 大脑/发动机负责推理、生成文本本身无记忆、无工具、不会循环执行Harness 马具/驾驭系统负责把模型的思考变成行动——管理上下文、调工具、跑 ReAct 循环、处理错误重试、设安全护栏等类比模型是野马Harness 是缰绳马鞍骑手——不提供奔跑的动力但决定往哪跑、何时停、不出事Harness 通常包含什么组件说明编排循环(Orchestration Loop)Thought→Action→ObservationReAct决定何时继续/停止工具调用 路由注册工具 schema、解析模型 tool_call、沙箱执行、捕获结果上下文/记忆管理短期对话历史 长期持久化记忆 上下文压缩/裁剪Prompt 构建系统提示词、工具描述注入、格式约束错误处理 重试解析失败回退、超时、指数退避重试安全护栏(Guardrails)输入/输出过滤、高危工具人工审批(HITL)观测 日志tracing、评分、用于 debug 和 eval两种常见语境Runtime Harness运行层——上面说的 Agent 执行框架LangChain/LangGraph、CrewAI、AutoGen 的本质都是 harness 实现Claude Code 官方自称 the agentic harness around ClaudeEvaluation Harness评测框架——SWE-bench、AgentBench、GAIA 中用来跑 Agent、收集轨迹并打分的测试基础设施Harness vs Scaffolding常混淆社区细拆时Scaffolding 模型能看到的东西system prompt、工具描述、输出格式——塑造行为边界Harness 真正驱动运行的东西调模型 API、执行工具、判断停止条件——执行引擎简化讨论时常合并说Agent Model HarnessHarness ≈ Scaffolding 执行层简单记Harness 就是让 LLM 能干活的那整套工程壳子模型决定上限Harness 决定下限和稳定性。 相关新闻 如何在Linux上轻松搞定RTL8821CU无线网卡驱动:终极安装指南 如何在Linux上轻松搞定RTL8821CU无线网卡驱动:终极安装指南 【免费下载链接】rtl8821CU Realtek RTL8811CU/RTL8821CU USB Wi-Fi adapter driver for Linux 项目地址: https://gitcode.com/gh_mirrors/rt/rtl8821CU 还在为Linux系统下找不到合适的RTL8821CU无… 2026/6/10 13:18:21 解锁Mac视频预览:让Finder原生支持MKV、AVI等40+视频格式 解锁Mac视频预览:让Finder原生支持MKV、AVI等40视频格式 【免费下载链接】QuickLookVideo This package allows macOS Finder to display thumbnails, static QuickLook previews, cover art and metadata for most types of video files. 项目地址: https://gitc… 2026/6/10 13:12:17 最长湍流子数组——动态规划 给定一个整数数组 arr ,返回 arr 的 最大湍流子数组的长度 。如果比较符号在子数组中的每个相邻元素对之间翻转,则该子数组是 湍流子数组 。更正式地来说,当 arr 的子数组 A[i], A[i1], ..., A[j] 满足仅满足下列条件时,我们称其为… 2026/6/10 13:12:17 最新新闻 7分钟掌握思源宋体CN:开源中文字体完全应用指南 7分钟掌握思源宋体CN:开源中文字体完全应用指南 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 还在为中文项目寻找既专业又完全免费的开源字体而烦恼吗?Source… 2026/6/11 8:18:40 用ESP32-S3做个桌面音乐频谱灯:手把手教你从声音传感器到LVGL显示(附完整源码) 用ESP32-S3打造沉浸式音乐频谱灯:从硬件选型到视觉特效全解析在智能硬件爱好者的世界里,将技术创意转化为桌面艺术品总是一种独特的乐趣。想象一下,当你沉浸在音乐中时,桌面上的一盏灯能实时将旋律转化为流动的光影——这就是我们… 2026/6/11 8:18:40 9年没动静,这神器一更新,还是业内最强! 硬盘红了?空间告急?想删东西又怕误删?是不是找遍了各种清理工具,总觉得差点意思? 今天给你挖到一个 “古董级” 王者!它叫 SpaceSniffer! 这伙计,上次更新还是2016年,整整 9年 没动静啊!就在大家以为它凉透了的时候,2025年,它居然“诈尸”更新了! 更牛的是,装上… 2026/6/11 8:18:40 告别手动建模:用Python脚本在CATIA里自动画一个L型零件(附完整代码) 用Python脚本在CATIA中实现L型零件全自动建模:从零到工业级实践在机械设计领域,重复性建模工作消耗了工程师大量宝贵时间。传统手动操作CATIA绘制基础零件的方式,不仅效率低下,更难以应对参数化修改和批量生成的需求。本文将展示如… 2026/6/11 8:18:40 三款开箱即用神器,打开就是Pro版,效率拉满! 是不是经常遇到这种情况:想给屏幕画个重点讲解,结果软件太复杂还要注册?想放个酷炫时钟在桌面,找半天都是花里胡哨的?或者就想快速看个PDF,软件却卡得像老爷车?别折腾了!今天分享三个… 2026/6/11 8:18:40 告别Excel图表!用aardio+ScottPlot在Windows桌面快速绘制38种专业图表(附完整源码) 用aardioScottPlot打造Windows桌面级数据可视化利器还在为Excel图表导出到应用程序的繁琐流程头疼吗?当我们需要在内部工具或客户端软件中集成数据可视化功能时,传统方案往往面临格式兼容性差、交互性弱、定制困难等问题。aardio与ScottPlot的组合为Wind… 2026/6/11 7:18:40 日新闻 Windows本地GUI工具:拖拽式批量伪造文件MD5值(含备份与皮肤切换) 本文还有配套的精品资源,点击获取 简介:一套在Windows上离线运行的图形化工具,专为需要可控修改文件MD5哈希值的场景设计。主程序BatchMD5Modify.exe支持拖放添加多个文件,一键批量写入指定MD5值,同时自动保存原始哈… 2026/6/11 0:18:26 一阶直线倒立摆LQR控制器MATLAB实操包(含可运行Simulink模型与响应曲线) 本文还有配套的精品资源,点击获取 简介:直接上手就能跑的一阶直线倒立摆LQR控制仿真资源,包含主控脚本main_lip1.m、参数调节函数change.m、LQR封装函数lqr1_funtion.m,以及已验证可用的Simulink模型lip_lqr.slx(含… 2026/6/11 0:18:26 DVMSLAM中的sim3变换 DVM-SLAM 中的 Sim(3) 变换:从地图合并到持续对齐核心结论:Sim(3) 是 DVM-SLAM 解决“单目多机器人坐标系不一致”的几何工具,它负责把不同 agent 的地图从各自 world frame 对齐到同一个 group frame。1. 一句话解释 Sim(3) 在 DVM-SLAM 中&… 2026/6/11 0:18:26 周新闻 保姆级教程:用MounRiver Studio(MRS)给CH32V103和CH32F103开发板‘跑个分’ 从零开始:用MounRiver Studio快速验证CH32V103与CH32F103开发板性能拿到一款新的开发板,最令人兴奋的莫过于快速验证它的基础功能是否正常。对于嵌入式开发者来说,一个高效、稳定的开发环境是项目成功的关键。今天,我们就以南京沁… 2026/6/11 6:11:34 配电站智能运维|变电一次设备识别|高压电气构件目标检测数据集|电力巡检 配电站智能运维|变电一次设备识别|高压电气构件目标检测数据集|电力巡检10369 标签:#配电站AI巡检 #变电设备识别 #电力深度学习 #目标检测 #高压器件检测 #智能变电站 #YOLO工程落地 #电力设备缺陷排查 #工业视觉运维 新型电力系统加速落地背… 2026/6/10 12:06:50 揭秘平台风控拦截逻辑:开通CSDN AI数字营销后,72小时解限成功率从12%跃升至89%(附风控白名单准入清单) 更多请点击: https://codechina.net 第一章:私域引流被平台风控,开通 CSDN AI 数字营销后能解除吗? 当私域流量运营遭遇平台风控(如微信、抖音、小红书等对诱导跳转、二维码/链接批量分发等行为的限流或封禁ÿ… 2026/6/10 6:50:07 月新闻 仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/10 11:39:43 【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/10 18:49:02 Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/10 18:46:05
如何在Linux上轻松搞定RTL8821CU无线网卡驱动:终极安装指南 如何在Linux上轻松搞定RTL8821CU无线网卡驱动:终极安装指南 【免费下载链接】rtl8821CU Realtek RTL8811CU/RTL8821CU USB Wi-Fi adapter driver for Linux 项目地址: https://gitcode.com/gh_mirrors/rt/rtl8821CU 还在为Linux系统下找不到合适的RTL8821CU无… 2026/6/10 13:18:21
解锁Mac视频预览:让Finder原生支持MKV、AVI等40+视频格式 解锁Mac视频预览:让Finder原生支持MKV、AVI等40视频格式 【免费下载链接】QuickLookVideo This package allows macOS Finder to display thumbnails, static QuickLook previews, cover art and metadata for most types of video files. 项目地址: https://gitc… 2026/6/10 13:12:17
最长湍流子数组——动态规划 给定一个整数数组 arr ,返回 arr 的 最大湍流子数组的长度 。如果比较符号在子数组中的每个相邻元素对之间翻转,则该子数组是 湍流子数组 。更正式地来说,当 arr 的子数组 A[i], A[i1], ..., A[j] 满足仅满足下列条件时,我们称其为… 2026/6/10 13:12:17
7分钟掌握思源宋体CN:开源中文字体完全应用指南 7分钟掌握思源宋体CN:开源中文字体完全应用指南 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 还在为中文项目寻找既专业又完全免费的开源字体而烦恼吗?Source… 2026/6/11 8:18:40
用ESP32-S3做个桌面音乐频谱灯:手把手教你从声音传感器到LVGL显示(附完整源码) 用ESP32-S3打造沉浸式音乐频谱灯:从硬件选型到视觉特效全解析在智能硬件爱好者的世界里,将技术创意转化为桌面艺术品总是一种独特的乐趣。想象一下,当你沉浸在音乐中时,桌面上的一盏灯能实时将旋律转化为流动的光影——这就是我们… 2026/6/11 8:18:40
9年没动静,这神器一更新,还是业内最强! 硬盘红了?空间告急?想删东西又怕误删?是不是找遍了各种清理工具,总觉得差点意思? 今天给你挖到一个 “古董级” 王者!它叫 SpaceSniffer! 这伙计,上次更新还是2016年,整整 9年 没动静啊!就在大家以为它凉透了的时候,2025年,它居然“诈尸”更新了! 更牛的是,装上… 2026/6/11 8:18:40
告别手动建模:用Python脚本在CATIA里自动画一个L型零件(附完整代码) 用Python脚本在CATIA中实现L型零件全自动建模:从零到工业级实践在机械设计领域,重复性建模工作消耗了工程师大量宝贵时间。传统手动操作CATIA绘制基础零件的方式,不仅效率低下,更难以应对参数化修改和批量生成的需求。本文将展示如… 2026/6/11 8:18:40
三款开箱即用神器,打开就是Pro版,效率拉满! 是不是经常遇到这种情况:想给屏幕画个重点讲解,结果软件太复杂还要注册?想放个酷炫时钟在桌面,找半天都是花里胡哨的?或者就想快速看个PDF,软件却卡得像老爷车?别折腾了!今天分享三个… 2026/6/11 8:18:40
告别Excel图表!用aardio+ScottPlot在Windows桌面快速绘制38种专业图表(附完整源码) 用aardioScottPlot打造Windows桌面级数据可视化利器还在为Excel图表导出到应用程序的繁琐流程头疼吗?当我们需要在内部工具或客户端软件中集成数据可视化功能时,传统方案往往面临格式兼容性差、交互性弱、定制困难等问题。aardio与ScottPlot的组合为Wind… 2026/6/11 7:18:40
Windows本地GUI工具:拖拽式批量伪造文件MD5值(含备份与皮肤切换) 本文还有配套的精品资源,点击获取 简介:一套在Windows上离线运行的图形化工具,专为需要可控修改文件MD5哈希值的场景设计。主程序BatchMD5Modify.exe支持拖放添加多个文件,一键批量写入指定MD5值,同时自动保存原始哈… 2026/6/11 0:18:26
一阶直线倒立摆LQR控制器MATLAB实操包(含可运行Simulink模型与响应曲线) 本文还有配套的精品资源,点击获取 简介:直接上手就能跑的一阶直线倒立摆LQR控制仿真资源,包含主控脚本main_lip1.m、参数调节函数change.m、LQR封装函数lqr1_funtion.m,以及已验证可用的Simulink模型lip_lqr.slx(含… 2026/6/11 0:18:26
DVMSLAM中的sim3变换 DVM-SLAM 中的 Sim(3) 变换:从地图合并到持续对齐核心结论:Sim(3) 是 DVM-SLAM 解决“单目多机器人坐标系不一致”的几何工具,它负责把不同 agent 的地图从各自 world frame 对齐到同一个 group frame。1. 一句话解释 Sim(3) 在 DVM-SLAM 中&… 2026/6/11 0:18:26
保姆级教程:用MounRiver Studio(MRS)给CH32V103和CH32F103开发板‘跑个分’ 从零开始:用MounRiver Studio快速验证CH32V103与CH32F103开发板性能拿到一款新的开发板,最令人兴奋的莫过于快速验证它的基础功能是否正常。对于嵌入式开发者来说,一个高效、稳定的开发环境是项目成功的关键。今天,我们就以南京沁… 2026/6/11 6:11:34
配电站智能运维|变电一次设备识别|高压电气构件目标检测数据集|电力巡检 配电站智能运维|变电一次设备识别|高压电气构件目标检测数据集|电力巡检10369 标签:#配电站AI巡检 #变电设备识别 #电力深度学习 #目标检测 #高压器件检测 #智能变电站 #YOLO工程落地 #电力设备缺陷排查 #工业视觉运维 新型电力系统加速落地背… 2026/6/10 12:06:50
揭秘平台风控拦截逻辑:开通CSDN AI数字营销后,72小时解限成功率从12%跃升至89%(附风控白名单准入清单) 更多请点击: https://codechina.net 第一章:私域引流被平台风控,开通 CSDN AI 数字营销后能解除吗? 当私域流量运营遭遇平台风控(如微信、抖音、小红书等对诱导跳转、二维码/链接批量分发等行为的限流或封禁ÿ… 2026/6/10 6:50:07
仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/10 11:39:43
【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/10 18:49:02
Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/10 18:46:05