别光让AI写代码了,RAG帮你把测试用例生成效率拉满——测试同学实操手册 发布时间:2026/6/25 17:22:53 做测试的兄弟应该都懂这种感觉产品经理扔过来一份需求文档你对着屏幕开始一条一条憋用例——正常流程、异常流程、边界值、组合场景……写了半天抬头一看才覆盖了不到三分之一。更扎心的是好不容易写完需求改了。传统的测试用例编写方式本质上是在拼两样东西时间和经验。时间够不够用决定了你能写多少条经验够不够丰富决定了你能覆盖多少死角。但这两样东西在敏捷迭代面前永远不够。所以最近大半年我开始认真研究RAG检索增强生成在测试场景里的落地。跑了几个项目之后可以负责任地说一句这东西确实能干活但前提是你得知道怎么用它。先花30秒搞清楚RAG到底在干啥RAG的全称是Retrieval-Augmented Generation翻译成人话就是“先翻资料再答题”。以前你直接让大模型生成测试用例它全靠预训练时学到的“通用知识”来编。结果就是它可能根本不认识你们公司的业务术语也不知道你们API接口到底长什么样生成出来的用例看着像模像样实际一跑全废。RAG的思路很简单在让大模型写答案之前先从你们公司的文档库里把相关的资料搜出来连同问题一起塞给模型。模型不再是“凭记忆瞎编”而是“拿着资料照着写”。类比一下就是——不RAG相当于闭卷考试RAG相当于开卷考试。开卷和闭卷的区别不用我多说了吧。测试人员用好RAG的四步实操第一步把知识库搭起来这是地基RAG的效果70%取决于你的知识库质量剩下30%才是模型和参数的事。哪些东西应该喂进去PRD/需求文档用例的来源没有这个后面的都白搭API接口文档Swagger/OpenAPI格式最好结构化程度高历史测试用例库让模型学习你们团队的用例风格和覆盖思路缺陷库/Bug报告历史踩过的坑让模型知道哪些地方容易出问题设计稿/UI说明能提取文字就提取前端测试用得上建知识库的时候有个坑要注意文档不是越大越好要切块。长文档整段塞进去检索精度会直线下降。一般建议按章节或按功能点切成小块用滑动窗口的方式保证语义连贯。向量数据库选型方面小团队用ChromaDB就够数据量大的上Milvus或Weaviate。嵌入模型中文场景推荐BGE-Large-Zh效果比较稳。第二步设计好提示词别让模型自由发挥很多测试同学把RAG用废了问题出在提示词上——太随意。一个合格的测试用例生成提示词至少应该包含这几层你是一名资深测试开发工程师。请根据以下【测试需求】和【参考知识】生成测试用例。 【测试需求】 {用户输入的需求描述} 【参考知识】 {从知识库检索到的相关文档片段} 要求 1. 覆盖正常流程、异常流程、边界值 2. 每个用例包含用例编号、前置条件、测试步骤、预期结果 3. 优先覆盖高风险场景参考历史缺陷库核心逻辑就一句话告诉模型你是谁、要干嘛、拿什么资料干、按什么格式交作业。缺了任何一环出来的东西都可能跑偏。第三步调检索参数别让模型“找不到”或“找太多”检索是RAG的咽喉。检索出来的东西不对后面生成什么都不对。几个可以调的参数Top-K每次检索返回多少条结果。K太小可能漏掉关键信息K太大上下文太长模型会“失焦”。一般5-10是个不错的起步区间。相似度阈值低于这个相似度的结果直接丢弃避免把不相关的东西喂给模型。分块大小Chunk Size块太大检索精度差块太小上下文割裂。根据文档类型调接口文档可以切小一点需求文档可以稍大。另外可以考虑混合检索——向量检索关键词检索结合。向量检索擅长语义匹配关键词检索擅长精确匹配比如接口名、字段名两者互补效果更好。第四步建反馈闭环让系统越用越聪明RAG不是一次性工程。用得越多应该越准。怎么做把测试执行的结果反向喂回去哪些用例执行通过了→说明生成质量OK标记为正样本哪些用例执行失败了→分析原因是文档错了还是模型理解错了把问题反馈到知识库或提示词里哪些场景模型漏掉了→补充到知识库中天猫技术团队的实践数据可以参考C端业务用例采纳率达到85%以上中小型需求的用例编写时效从2小时降到0.5小时提升75%。他们能做到这个水平靠的就是“需求规范化Prompt工程知识库RAG平台化集成”这套闭环策略。进阶玩法GraphRAG和多智能体前面讲的都是“朴素RAG”——向量检索生成。如果你们系统业务逻辑特别复杂实体之间关系盘根错节可以看看GraphRAG。GraphRAG在RAG的基础上加了一层知识图谱。它不只看“文本相似”还能沿着关系路径去推理。比如你要测“订单退款”场景朴素RAG可能只搜到退款相关的文档片段GraphRAG还能把“订单”“支付”“库存”“优惠券”这些关联实体的信息一并带出来覆盖更全。再往上走一步就是多智能体协作。把不同的测试任务拆给不同的Agent一个负责需求分析、一个负责用例生成、一个负责脚本编写、一个负责回归影响分析。每个Agent专注做一件事RAG作为它们共同的知识底座。苹果最近提出的Agentic RAG框架就是这么玩的目标是把质量工程师30-40%的手工编写时间省下来。最后说几句实在话RAG不是什么玄学它本质上就是一个“让AI带着资料干活”的工具。对测试人员来说最大的价值不是“取代你写用例”而是把你从重复劳动里解放出来让你把精力放在更值得花时间的事情上——比如设计更刁钻的测试策略、分析更复杂的业务场景。但前提是你得把知识库建好、把提示词写好、把检索调好、把闭环跑通。缺任何一个环节效果都会大打折扣。工具摆在那用得好不好看人。 相关新闻 路径遍历漏洞深度剖析:从原理到复现与修复 1. 项目概述:一次典型的路径遍历漏洞分析与复现最近在梳理一些企业级应用的历史漏洞时,赛普EAP企业适配管理平台的Download.aspx文件任意文件读取漏洞引起了我的注意。这并非一个复杂的高危RCE(远程代码执行),但它非常… 2026/6/25 17:22:53 零基础搭建Hadoop大数据处理环境 搭建Hadoop学习环境,建议使用VMware Workstation安装CentOS 7,通过复制虚拟机快速创建多节点,并逐一修改IP和主机名。采用NAT模式上网,确保虚拟机能访问物理机,且IP不受外部网络变化影响。 关键网络配置:VM… 2026/6/25 17:22:53 量化交易数据获取的终极解决方案:用efinance一站式获取股票、基金、债券、期货数据 量化交易数据获取的终极解决方案:用efinance一站式获取股票、基金、债券、期货数据 【免费下载链接】efinance efinance 是一个可以快速获取基金、股票、债券、期货数据的 Python 库,回测以及量化交易的好帮手!🚀🚀&am… 2026/6/25 17:15:55 最新新闻 CVE-2025-32395漏洞剖析:Vite开发服务器路径遍历与安全加固实战 1. 项目概述:一次对现代前端构建工具的深度安全审视最近在安全研究圈里,一个关于Vite的漏洞讨论热度不低,编号是CVE-2025-32395。这个漏洞的核心是“权限绕过导致的任意文件读取”。乍一听,很多前端开发者可能会觉得意外ÿ… 2026/6/25 18:22:57 Log4j2漏洞深度解析:从JNDI注入原理到企业级应急响应实战 1. 项目概述:一次足以载入史册的漏洞风暴2021年12月,一个编号为CVE-2021-44228的漏洞在安全圈乃至整个互联网行业掀起了滔天巨浪。它有一个更广为人知的名字——“Log4Shell”。这个潜伏在Apache Log4j2日志组件中的远程代码执行漏洞,因其利用… 2026/6/25 18:22:57 从产品设计角度看「适趣古诗词」的分级与复习机制 “鹅鹅鹅,曲项向天歌”——这句话几乎每个中国孩子都会背。但如果你问孩子"这首诗是什么意思"“骆宾王是谁”,大多数孩子答不上来。 背诗不难,理解诗才难。 今天我想聊聊「适趣古诗词」的核心理念:不是让孩子"背诗… 2026/6/25 18:22:57 致远FE平台apprvaddNew接口SQL注入漏洞挖掘与防御实践 1. 项目概述:一次典型的业务接口漏洞挖掘之旅最近在梳理一些主流协同办公系统的安全性,致远互联的FE协作办公平台自然进入了视野。这类系统通常承载着企业核心的审批、流程和数据,一旦出现安全问题,影响面会非常广。在针对其移动端… 2026/6/25 18:22:56 WebSocket认证绕过漏洞深度剖析:从CVE-2026-39987看实时交互应用安全 1. 项目概述:一个被低估的WebSocket认证绕过漏洞最近在分析一些开源项目的安全实现时,我遇到了一个非常典型的案例:CVE-2026-39987。这个漏洞影响的是marimo项目,一个用于构建交互式Python笔记本和应用的框架。漏洞的核心在于其内… 2026/6/25 18:22:56 MitoHiFi线粒体基因组组装:从入门到精通的完整指南 MitoHiFi线粒体基因组组装:从入门到精通的完整指南 【免费下载链接】MitoHiFi Find, circularise and annotate mitogenome from PacBio assemblies 项目地址: https://gitcode.com/gh_mirrors/mi/MitoHiFi 线粒体基因组组装是基因组学研究中的重要环节&… 2026/6/25 17:22:53 日新闻 OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49 决策树可解释性实战:三层探针系统构建业务可理解的AI决策 1. 项目概述:当决策树不再“透明”,我们该如何真正看清它?决策树分类器常被称作机器学习里的“白盒模型”——结构清晰、分支可追溯、预测路径一目了然。但现实远比教科书复杂:一棵深度为12、节点数超3000的树,用graph… 2026/6/25 12:22:52 Java八股-线程池与并发为什么总出问题 Java八股:线程池与并发为什么总出问题 文章目录Java八股:线程池与并发为什么总出问题先说结论线程池到底解决什么线程池为什么会出问题一个线程池的执行过程为什么锁总是和并发题一起出现面试最常问的几个点实战里怎么设计更稳一个更稳的回答模板结尾先说… 2026/6/25 12:22:52 周新闻 第四章:本体推理的技术基础设施 当LLM不够用了——本体推理的企业决策实践第三章讲了"怎么落地"的方法论。这一章聚焦在"落地靠什么"——推理的技术基础设施。 如果说前三章是在论证"为什么要做本体推理"和"怎么做才能不失败",那么从这一章开始࿰… 2026/6/24 17:34:30 OpenClaw:本地AI工作流的可编程调度中枢 1. OpenClaw不是“另一个前端界面”,而是本地AI工作流的中枢调度器很多人第一次看到 OpenClaw,下意识会把它当成 ComfyUI 或 Ollama Web UI 那类图形化前端——点几下就能调模型、聊聊天。我最初也这么想,直到在 Ubuntu 24.04.4 的移动硬盘虚… 2026/6/24 17:34:33 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 【免费下载链接】Deceive 🎩 Appear offline for League of Legends, VALORANT, and Legends of Runeterra. 项目地址: https://gitcode.com/gh_mirrors/de/Deceive 你是否曾因为登录游戏就被… 2026/6/24 17:34:35 月新闻 仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/25 5:32:38 【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/25 3:47:27 Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/25 9:51:33
路径遍历漏洞深度剖析:从原理到复现与修复 1. 项目概述:一次典型的路径遍历漏洞分析与复现最近在梳理一些企业级应用的历史漏洞时,赛普EAP企业适配管理平台的Download.aspx文件任意文件读取漏洞引起了我的注意。这并非一个复杂的高危RCE(远程代码执行),但它非常… 2026/6/25 17:22:53
零基础搭建Hadoop大数据处理环境 搭建Hadoop学习环境,建议使用VMware Workstation安装CentOS 7,通过复制虚拟机快速创建多节点,并逐一修改IP和主机名。采用NAT模式上网,确保虚拟机能访问物理机,且IP不受外部网络变化影响。 关键网络配置:VM… 2026/6/25 17:22:53
量化交易数据获取的终极解决方案:用efinance一站式获取股票、基金、债券、期货数据 量化交易数据获取的终极解决方案:用efinance一站式获取股票、基金、债券、期货数据 【免费下载链接】efinance efinance 是一个可以快速获取基金、股票、债券、期货数据的 Python 库,回测以及量化交易的好帮手!🚀🚀&am… 2026/6/25 17:15:55
CVE-2025-32395漏洞剖析:Vite开发服务器路径遍历与安全加固实战 1. 项目概述:一次对现代前端构建工具的深度安全审视最近在安全研究圈里,一个关于Vite的漏洞讨论热度不低,编号是CVE-2025-32395。这个漏洞的核心是“权限绕过导致的任意文件读取”。乍一听,很多前端开发者可能会觉得意外ÿ… 2026/6/25 18:22:57
Log4j2漏洞深度解析:从JNDI注入原理到企业级应急响应实战 1. 项目概述:一次足以载入史册的漏洞风暴2021年12月,一个编号为CVE-2021-44228的漏洞在安全圈乃至整个互联网行业掀起了滔天巨浪。它有一个更广为人知的名字——“Log4Shell”。这个潜伏在Apache Log4j2日志组件中的远程代码执行漏洞,因其利用… 2026/6/25 18:22:57
从产品设计角度看「适趣古诗词」的分级与复习机制 “鹅鹅鹅,曲项向天歌”——这句话几乎每个中国孩子都会背。但如果你问孩子"这首诗是什么意思"“骆宾王是谁”,大多数孩子答不上来。 背诗不难,理解诗才难。 今天我想聊聊「适趣古诗词」的核心理念:不是让孩子"背诗… 2026/6/25 18:22:57
致远FE平台apprvaddNew接口SQL注入漏洞挖掘与防御实践 1. 项目概述:一次典型的业务接口漏洞挖掘之旅最近在梳理一些主流协同办公系统的安全性,致远互联的FE协作办公平台自然进入了视野。这类系统通常承载着企业核心的审批、流程和数据,一旦出现安全问题,影响面会非常广。在针对其移动端… 2026/6/25 18:22:56
WebSocket认证绕过漏洞深度剖析:从CVE-2026-39987看实时交互应用安全 1. 项目概述:一个被低估的WebSocket认证绕过漏洞最近在分析一些开源项目的安全实现时,我遇到了一个非常典型的案例:CVE-2026-39987。这个漏洞影响的是marimo项目,一个用于构建交互式Python笔记本和应用的框架。漏洞的核心在于其内… 2026/6/25 18:22:56
MitoHiFi线粒体基因组组装:从入门到精通的完整指南 MitoHiFi线粒体基因组组装:从入门到精通的完整指南 【免费下载链接】MitoHiFi Find, circularise and annotate mitogenome from PacBio assemblies 项目地址: https://gitcode.com/gh_mirrors/mi/MitoHiFi 线粒体基因组组装是基因组学研究中的重要环节&… 2026/6/25 17:22:53
OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49
决策树可解释性实战:三层探针系统构建业务可理解的AI决策 1. 项目概述:当决策树不再“透明”,我们该如何真正看清它?决策树分类器常被称作机器学习里的“白盒模型”——结构清晰、分支可追溯、预测路径一目了然。但现实远比教科书复杂:一棵深度为12、节点数超3000的树,用graph… 2026/6/25 12:22:52
Java八股-线程池与并发为什么总出问题 Java八股:线程池与并发为什么总出问题 文章目录Java八股:线程池与并发为什么总出问题先说结论线程池到底解决什么线程池为什么会出问题一个线程池的执行过程为什么锁总是和并发题一起出现面试最常问的几个点实战里怎么设计更稳一个更稳的回答模板结尾先说… 2026/6/25 12:22:52
第四章:本体推理的技术基础设施 当LLM不够用了——本体推理的企业决策实践第三章讲了"怎么落地"的方法论。这一章聚焦在"落地靠什么"——推理的技术基础设施。 如果说前三章是在论证"为什么要做本体推理"和"怎么做才能不失败",那么从这一章开始࿰… 2026/6/24 17:34:30
OpenClaw:本地AI工作流的可编程调度中枢 1. OpenClaw不是“另一个前端界面”,而是本地AI工作流的中枢调度器很多人第一次看到 OpenClaw,下意识会把它当成 ComfyUI 或 Ollama Web UI 那类图形化前端——点几下就能调模型、聊聊天。我最初也这么想,直到在 Ubuntu 24.04.4 的移动硬盘虚… 2026/6/24 17:34:33
3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 【免费下载链接】Deceive 🎩 Appear offline for League of Legends, VALORANT, and Legends of Runeterra. 项目地址: https://gitcode.com/gh_mirrors/de/Deceive 你是否曾因为登录游戏就被… 2026/6/24 17:34:35
仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/25 5:32:38
【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/25 3:47:27
Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/25 9:51:33