RAG:17种优化策略 发布时间:2026/6/25 15:41:13 RAG的17种优化策略主要分为文档分块优化、检索排序优化、反馈与自适应优化三大类以下是完整17种策略汇总及核心特点一、文档分块优化5种这类优化聚焦于优化知识表示提升后续检索精准性Simple RAG基础分块原理将原始文档按固定字符数/长度硬切分切分后直接进行向量化和Top-K检索是所有RAG策略的基础起点特点实现简单技术成本低响应速度快但易割裂语义连续性检索精度低GPT评分为0.3分Semantic Chunking语义切分原理通过句法树/NLP模型动态切割文本合并高相似度相邻句子保证每个块都是完整语义单元特点保留语义完整性技术成本低响应速度快但仍存在小块上下文丢失问题检索精度中等GPT评分为0.5分Context Enriched Retrieval上下文增强原理找到目标相关块后同步召回其前后相邻段落组成更大的上下文块避免信息断裂特点轻量化解决信息不完整问题帮助模型理解完整语义技术成本低检索精度中等GPT评分为0.6分Contextual Chunk Headers块标题增强原理对切分后的大段文本调用大模型生成概括性块标题向量化时将标题文本共同编码检索时同时计算标题和文本与查询的相似度特点增强全局信息感知更精准评估相关性技术成本低检索精度中等GPT评分为0.5分Document Augmentation文档增强原理将每个文本块转化为一组覆盖核心内容的问题分别存储文本和问题的向量检索时综合计算查询与文本、问题的相似度特点匹配精度高能弥补语义鸿沟即使原文未出现关键词也能命中检索精度高GPT评分为0.8分二、检索排序优化4种这类优化聚焦于提升召回和排序的精准性降低噪音干扰Query Transformation查询转换原理对用户原始口语化查询进行改写优化包含查询重写、回溯扩展、子查询分解三种常见方式适配多样化提问场景特点处理模糊/复杂意图提升整体召回率交互式场景实用性高技术成本中等检索精度中等GPT评分为0.5分Re-ranker重排序原理先通过向量快速粗召回Top-K结果再用Cross-Encoder等模型对结果二次语义打分排序特点消除相似不相关噪音大幅提升结果相关性是当前RAG系统最常用的核心组件之一技术成本中等检索精度高GPT评分为0.7分RSE相关片段提取原理在已经检索到的长段落中通过BERT指针网络定位提取和查询最相关的关键片段特点处理复杂跨段落信息表现优异适合法律文书、科研论文等深度理解场景技术成本中等检索精度高GPT评分为0.8分Contextual Compression上下文压缩原理调用LLM过滤掉检索结果中的无关信息仅保留核心有用内容精炼上下文特点降低token消耗减少无关信息对答案生成的干扰技术成本中等检索精度高GPT评分为0.75分三、反馈与自适应优化8种这类优化聚焦于后处理与动态迭代实现RAG系统的持续进化Small-to-Big Retrieval小块查大块答原理切分文档为父子块小块用于检索计算相似度最终输入大模型生成回答时使用完整的父块特点兼顾检索精准性和上下文完整性在准确性和完整性之间取得较好平衡检索精度高GPT评分为0.85分Feedback Loop反馈闭环原理收集用户点击、满意度等反馈数据用于迭代训练排序模型优化检索结果排序特点让系统持续适应用户真实查询习惯适合智能客服等高频交互场景Adaptive RAG自适应路由原理根据问题类型、复杂度动态选择匹配的检索策略而非所有查询采用统一流程特点平衡精度和效率避免不必要的计算开销Self RAG自我决策原理让大模型自主判断当前问题是否需要外部检索不需要则直接回答需要再启动检索流程特点减少不必要检索提升响应效率同时降低无关检索引入的错误Knowledge Graph RAG知识图谱融合原理将文档解析为实体三元组构建知识图谱检索时结合图谱推理补充关联信息特点适合处理需要多实体关联推理的复杂问题提升答案逻辑性Hierarchical Indices多级索引原理构建文档树形分层索引先粗检索定位文档/章节再细粒度检索具体内容特点适配大规模长文档场景分层检索提升检索效率减少无效计算HyDE假设文档嵌入原理先让大模型生成一个针对查询的理想答案再用这个理想答案反向检索知识库中匹配的支撑材料特点解决碎片化文档检索难题提升语义匹配精准性RAG Fusion原理对查询进行多版本改写分别检索后对多个检索结果进行融合重排序提升相关片段召回率特点扩大检索覆盖面降低单轮检索漏检概率适合复杂开放问题 相关新闻 安防报警对讲系统中的“隐形杀手”:回音与噪声,如何用A-59模块一网打尽? 银行柜员按下紧急按钮,对讲机里却传来自己的回音;矿井下的求救呼叫,被风机噪音淹没;医院护士站的呼叫系统,病人说话断断续续……这些安防对讲中的致命问题,你可能从未重视。一、安防报警对讲:关… 2026/6/21 5:04:08 实时推荐系统升级迫在眉睫:4类高危信号预警+5个即插即用的AI工具协同模块 更多请点击: https://intelliparadigm.com 第一章:实时推荐系统升级迫在眉睫:4类高危信号预警5个即插即用的AI工具协同模块 当用户点击商品后跳转延迟超过1.8秒、AB测试转化率连续三周下滑、新用户7日留存跌破22%、或实时特征管道日均失败超… 2026/6/25 0:29:59 网易云音乐无损解析:3步解锁你的专属高品质音乐库 网易云音乐无损解析:3步解锁你的专属高品质音乐库 【免费下载链接】Netease_url 网易云无损解析 项目地址: https://gitcode.com/gh_mirrors/ne/Netease_url 你是否曾经遇到过这样的困境?在网易云音乐上收藏了无数心爱的歌曲,却苦于无… 2026/6/12 14:04:31 最新新闻 关于从算法工程化角度看空间换时间策略的权衡的技术7 算法工程化中的空间换时间策略概述定义空间换时间策略的核心思想常见应用场景(如缓存、预处理、哈希表优化等)工程化视角下的目标:性能优化与资源消耗的平衡空间换时间的典型技术实现预处理与预计算(如动态规划中的表驱动法&#… 2026/6/25 15:22:53 2026 智能体开发实战:GLM-5.2、Kimi-K2.7-code、Grok 等模型统一 API 调用方案 一、紧跟行业热点:Agent 时代开发者面临的现实难题 2026 年被业内公认为智能体落地元年。GLM-5.2、Kimi-K2.7-code 新版本接连发布,再加上 Grok 文生视频模型持续迭代,大量开发者开始搭建自动化任务机器人、项目级代码开发系统、AI 短视频生… 2026/6/25 15:22:53 多实例SpringBean的应用,在调用大模型的时候的手段 大模型调用需要实例,多个用户高并发产生的实例,单个实例需要多个用户请求使用,属于串行,需要等待单个实例的bean 所以我们需要创建多个实例对象,使得多个用户不需要排队等待,这样,采用SpringBea… 2026/6/25 15:22:53 10102黄大年茶思屋榜文101期 第2题 低比特/低精度数据格式快速微调 用户名:华夏之光永存摘要现有通信行业量化大模型微调链路存在刚性效率短板:int4/int8 量化权重必须反量化至 fp16/fp32 高精度后才能开展全参数微调,反量化、重量化两步额外流程使微调耗时膨胀 4 倍以上,且量化微调后精度劣化普遍… 2026/6/25 15:22:53 Hive数据倾斜原因及解决办法 Hive数据倾斜原因及解决办法 一、外JOIN过滤条件放置WHERE导致大量NULL热点Shuffle倾斜 1.1 倾斜成因 LEFT/RIGHT/FULL JOIN场景,维度过滤条件写在WHERE而非ON后,JOIN完成后再过滤,未匹配产生的海量NULL关联键全部参与Shuffle分发,… 2026/6/25 15:22:53 树莓派3 config.txt硬件初始化全解析:从黑屏到工业级稳定运行 1. 项目概述:树莓派3的config.txt不是“配置文件”,而是硬件启动总控开关你刚拿到一块树莓派3,刷好Raspberry Pi OS,插上显示器、键盘,通电——结果屏幕一片黑,或者只亮LOGO不进系统;又或者USB设… 2026/6/25 15:15:55 日新闻 OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49 决策树可解释性实战:三层探针系统构建业务可理解的AI决策 1. 项目概述:当决策树不再“透明”,我们该如何真正看清它?决策树分类器常被称作机器学习里的“白盒模型”——结构清晰、分支可追溯、预测路径一目了然。但现实远比教科书复杂:一棵深度为12、节点数超3000的树,用graph… 2026/6/25 12:22:52 Java八股-线程池与并发为什么总出问题 Java八股:线程池与并发为什么总出问题 文章目录Java八股:线程池与并发为什么总出问题先说结论线程池到底解决什么线程池为什么会出问题一个线程池的执行过程为什么锁总是和并发题一起出现面试最常问的几个点实战里怎么设计更稳一个更稳的回答模板结尾先说… 2026/6/25 12:22:52 周新闻 第四章:本体推理的技术基础设施 当LLM不够用了——本体推理的企业决策实践第三章讲了"怎么落地"的方法论。这一章聚焦在"落地靠什么"——推理的技术基础设施。 如果说前三章是在论证"为什么要做本体推理"和"怎么做才能不失败",那么从这一章开始࿰… 2026/6/24 17:34:30 OpenClaw:本地AI工作流的可编程调度中枢 1. OpenClaw不是“另一个前端界面”,而是本地AI工作流的中枢调度器很多人第一次看到 OpenClaw,下意识会把它当成 ComfyUI 或 Ollama Web UI 那类图形化前端——点几下就能调模型、聊聊天。我最初也这么想,直到在 Ubuntu 24.04.4 的移动硬盘虚… 2026/6/24 17:34:33 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 【免费下载链接】Deceive 🎩 Appear offline for League of Legends, VALORANT, and Legends of Runeterra. 项目地址: https://gitcode.com/gh_mirrors/de/Deceive 你是否曾因为登录游戏就被… 2026/6/24 17:34:35 月新闻 仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/25 5:32:38 【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/25 3:47:27 Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/25 9:51:33
安防报警对讲系统中的“隐形杀手”:回音与噪声,如何用A-59模块一网打尽? 银行柜员按下紧急按钮,对讲机里却传来自己的回音;矿井下的求救呼叫,被风机噪音淹没;医院护士站的呼叫系统,病人说话断断续续……这些安防对讲中的致命问题,你可能从未重视。一、安防报警对讲:关… 2026/6/21 5:04:08
实时推荐系统升级迫在眉睫:4类高危信号预警+5个即插即用的AI工具协同模块 更多请点击: https://intelliparadigm.com 第一章:实时推荐系统升级迫在眉睫:4类高危信号预警5个即插即用的AI工具协同模块 当用户点击商品后跳转延迟超过1.8秒、AB测试转化率连续三周下滑、新用户7日留存跌破22%、或实时特征管道日均失败超… 2026/6/25 0:29:59
网易云音乐无损解析:3步解锁你的专属高品质音乐库 网易云音乐无损解析:3步解锁你的专属高品质音乐库 【免费下载链接】Netease_url 网易云无损解析 项目地址: https://gitcode.com/gh_mirrors/ne/Netease_url 你是否曾经遇到过这样的困境?在网易云音乐上收藏了无数心爱的歌曲,却苦于无… 2026/6/12 14:04:31
关于从算法工程化角度看空间换时间策略的权衡的技术7 算法工程化中的空间换时间策略概述定义空间换时间策略的核心思想常见应用场景(如缓存、预处理、哈希表优化等)工程化视角下的目标:性能优化与资源消耗的平衡空间换时间的典型技术实现预处理与预计算(如动态规划中的表驱动法&#… 2026/6/25 15:22:53
2026 智能体开发实战:GLM-5.2、Kimi-K2.7-code、Grok 等模型统一 API 调用方案 一、紧跟行业热点:Agent 时代开发者面临的现实难题 2026 年被业内公认为智能体落地元年。GLM-5.2、Kimi-K2.7-code 新版本接连发布,再加上 Grok 文生视频模型持续迭代,大量开发者开始搭建自动化任务机器人、项目级代码开发系统、AI 短视频生… 2026/6/25 15:22:53
多实例SpringBean的应用,在调用大模型的时候的手段 大模型调用需要实例,多个用户高并发产生的实例,单个实例需要多个用户请求使用,属于串行,需要等待单个实例的bean 所以我们需要创建多个实例对象,使得多个用户不需要排队等待,这样,采用SpringBea… 2026/6/25 15:22:53
10102黄大年茶思屋榜文101期 第2题 低比特/低精度数据格式快速微调 用户名:华夏之光永存摘要现有通信行业量化大模型微调链路存在刚性效率短板:int4/int8 量化权重必须反量化至 fp16/fp32 高精度后才能开展全参数微调,反量化、重量化两步额外流程使微调耗时膨胀 4 倍以上,且量化微调后精度劣化普遍… 2026/6/25 15:22:53
Hive数据倾斜原因及解决办法 Hive数据倾斜原因及解决办法 一、外JOIN过滤条件放置WHERE导致大量NULL热点Shuffle倾斜 1.1 倾斜成因 LEFT/RIGHT/FULL JOIN场景,维度过滤条件写在WHERE而非ON后,JOIN完成后再过滤,未匹配产生的海量NULL关联键全部参与Shuffle分发,… 2026/6/25 15:22:53
树莓派3 config.txt硬件初始化全解析:从黑屏到工业级稳定运行 1. 项目概述:树莓派3的config.txt不是“配置文件”,而是硬件启动总控开关你刚拿到一块树莓派3,刷好Raspberry Pi OS,插上显示器、键盘,通电——结果屏幕一片黑,或者只亮LOGO不进系统;又或者USB设… 2026/6/25 15:15:55
OpenClaw:面向业务流程的智能体操作系统架构解析 1. OpenClaw 不是“另一个 Agent 框架”,而是面向真实业务流的智能体操作系统 你点开 GitHub 上 OpenClaw 的 README,第一眼看到的不是“支持多模型”“内置 20 Skill”,而是一张带虚线边框的三层架构图:最上层写着 Business Fl… 2026/6/25 0:22:49
决策树可解释性实战:三层探针系统构建业务可理解的AI决策 1. 项目概述:当决策树不再“透明”,我们该如何真正看清它?决策树分类器常被称作机器学习里的“白盒模型”——结构清晰、分支可追溯、预测路径一目了然。但现实远比教科书复杂:一棵深度为12、节点数超3000的树,用graph… 2026/6/25 12:22:52
Java八股-线程池与并发为什么总出问题 Java八股:线程池与并发为什么总出问题 文章目录Java八股:线程池与并发为什么总出问题先说结论线程池到底解决什么线程池为什么会出问题一个线程池的执行过程为什么锁总是和并发题一起出现面试最常问的几个点实战里怎么设计更稳一个更稳的回答模板结尾先说… 2026/6/25 12:22:52
第四章:本体推理的技术基础设施 当LLM不够用了——本体推理的企业决策实践第三章讲了"怎么落地"的方法论。这一章聚焦在"落地靠什么"——推理的技术基础设施。 如果说前三章是在论证"为什么要做本体推理"和"怎么做才能不失败",那么从这一章开始࿰… 2026/6/24 17:34:30
OpenClaw:本地AI工作流的可编程调度中枢 1. OpenClaw不是“另一个前端界面”,而是本地AI工作流的中枢调度器很多人第一次看到 OpenClaw,下意识会把它当成 ComfyUI 或 Ollama Web UI 那类图形化前端——点几下就能调模型、聊聊天。我最初也这么想,直到在 Ubuntu 24.04.4 的移动硬盘虚… 2026/6/24 17:34:33
3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 3分钟打造你的游戏隐身衣:用Deceive重新掌控社交边界 【免费下载链接】Deceive 🎩 Appear offline for League of Legends, VALORANT, and Legends of Runeterra. 项目地址: https://gitcode.com/gh_mirrors/de/Deceive 你是否曾因为登录游戏就被… 2026/6/24 17:34:35
仅剩47小时!Gemini 2.5欧洲语言模型权重微调窗口即将关闭:3个轻量级LoRA适配器+1套验证集,零代码快速部署 更多请点击: https://codechina.net 第一章:Gemini 2.5欧洲语言翻译能力演进与窗口期战略意义 Gemini 2.5在欧洲语言支持方面实现了质的跃升,尤其在德语、法语、西班牙语、意大利语及葡萄牙语的长上下文跨语言对齐、术语一致性保持和文化语境… 2026/6/25 5:32:38
【Gemini客户反馈分析实战指南】:20年AI产品专家亲授3大高价值洞察模型与落地工具包 更多请点击: https://kaifayun.com 第一章:Gemini客户反馈分析的核心价值与演进脉络 在AI产品持续迭代的背景下,Gemini模型的客户反馈已从早期零散的体验吐槽,逐步演变为结构化、多模态、实时驱动的关键决策依据。其核心价值不仅… 2026/6/25 3:47:27
Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 更多请点击: https://intelliparadigm.com 第一章:Gemini用户差评聚类分析:3大隐性需求缺口暴露,错过本周将影响Q3产品迭代优先级 我们对2024年6月1日–6月28日期间App Store与Google Play中含“Gemini”关键词的12,743条低分&a… 2026/6/25 9:51:33