RAG：17种优化策略

发布时间：2026/6/25 15:41:13

RAG的17种优化策略主要分为‌文档分块优化、检索排序优化、反馈与自适应优化‌三大类以下是完整17种策略汇总及核心特点一、文档分块优化5种这类优化聚焦于优化知识表示提升后续检索精准性‌Simple RAG基础分块‌原理将原始文档按固定字符数/长度硬切分切分后直接进行向量化和Top-K检索是所有RAG策略的基础起点特点实现简单技术成本低响应速度快但易割裂语义连续性检索精度低GPT评分为0.3分‌Semantic Chunking语义切分‌原理通过句法树/NLP模型动态切割文本合并高相似度相邻句子保证每个块都是完整语义单元特点保留语义完整性技术成本低响应速度快但仍存在小块上下文丢失问题检索精度中等GPT评分为0.5分‌Context Enriched Retrieval上下文增强‌原理找到目标相关块后同步召回其前后相邻段落组成更大的上下文块避免信息断裂特点轻量化解决信息不完整问题帮助模型理解完整语义技术成本低检索精度中等GPT评分为0.6分‌Contextual Chunk Headers块标题增强‌原理对切分后的大段文本调用大模型生成概括性块标题向量化时将标题文本共同编码检索时同时计算标题和文本与查询的相似度特点增强全局信息感知更精准评估相关性技术成本低检索精度中等GPT评分为0.5分‌Document Augmentation文档增强‌原理将每个文本块转化为一组覆盖核心内容的问题分别存储文本和问题的向量检索时综合计算查询与文本、问题的相似度特点匹配精度高能弥补语义鸿沟即使原文未出现关键词也能命中检索精度高GPT评分为0.8分二、检索排序优化4种这类优化聚焦于提升召回和排序的精准性降低噪音干扰‌Query Transformation查询转换‌原理对用户原始口语化查询进行改写优化包含查询重写、回溯扩展、子查询分解三种常见方式适配多样化提问场景特点处理模糊/复杂意图提升整体召回率交互式场景实用性高技术成本中等检索精度中等GPT评分为0.5分‌Re-ranker重排序‌原理先通过向量快速粗召回Top-K结果再用Cross-Encoder等模型对结果二次语义打分排序特点消除相似不相关噪音大幅提升结果相关性是当前RAG系统最常用的核心组件之一技术成本中等检索精度高GPT评分为0.7分‌RSE相关片段提取‌原理在已经检索到的长段落中通过BERT指针网络定位提取和查询最相关的关键片段特点处理复杂跨段落信息表现优异适合法律文书、科研论文等深度理解场景技术成本中等检索精度高GPT评分为0.8分‌Contextual Compression上下文压缩‌原理调用LLM过滤掉检索结果中的无关信息仅保留核心有用内容精炼上下文特点降低token消耗减少无关信息对答案生成的干扰技术成本中等检索精度高GPT评分为0.75分三、反馈与自适应优化8种这类优化聚焦于后处理与动态迭代实现RAG系统的持续进化‌Small-to-Big Retrieval小块查大块答‌原理切分文档为父子块小块用于检索计算相似度最终输入大模型生成回答时使用完整的父块特点兼顾检索精准性和上下文完整性在准确性和完整性之间取得较好平衡检索精度高GPT评分为0.85分‌Feedback Loop反馈闭环‌原理收集用户点击、满意度等反馈数据用于迭代训练排序模型优化检索结果排序特点让系统持续适应用户真实查询习惯适合智能客服等高频交互场景‌Adaptive RAG自适应路由‌原理根据问题类型、复杂度动态选择匹配的检索策略而非所有查询采用统一流程特点平衡精度和效率避免不必要的计算开销‌Self RAG自我决策‌原理让大模型自主判断当前问题是否需要外部检索不需要则直接回答需要再启动检索流程特点减少不必要检索提升响应效率同时降低无关检索引入的错误‌Knowledge Graph RAG知识图谱融合‌原理将文档解析为实体三元组构建知识图谱检索时结合图谱推理补充关联信息特点适合处理需要多实体关联推理的复杂问题提升答案逻辑性‌Hierarchical Indices多级索引‌原理构建文档树形分层索引先粗检索定位文档/章节再细粒度检索具体内容特点适配大规模长文档场景分层检索提升检索效率减少无效计算‌HyDE假设文档嵌入‌原理先让大模型生成一个针对查询的理想答案再用这个理想答案反向检索知识库中匹配的支撑材料特点解决碎片化文档检索难题提升语义匹配精准性‌RAG Fusion‌原理对查询进行多版本改写分别检索后对多个检索结果进行融合重排序提升相关片段召回率特点扩大检索覆盖面降低单轮检索漏检概率适合复杂开放问题

📰 新闻详情

RAG：17种优化策略

相关新闻

安防报警对讲系统中的“隐形杀手”：回音与噪声，如何用A-59模块一网打尽？

实时推荐系统升级迫在眉睫：4类高危信号预警+5个即插即用的AI工具协同模块

网易云音乐无损解析：3步解锁你的专属高品质音乐库

最新新闻

关于从算法工程化角度看空间换时间策略的权衡的技术7

2026 智能体开发实战：GLM-5.2、Kimi-K2.7-code、Grok 等模型统一 API 调用方案

多实例SpringBean的应用，在调用大模型的时候的手段

10102黄大年茶思屋榜文101期 第2题 低比特/低精度数据格式快速微调

Hive数据倾斜原因及解决办法

树莓派3 config.txt硬件初始化全解析：从黑屏到工业级稳定运行

日新闻

OpenClaw：面向业务流程的智能体操作系统架构解析

决策树可解释性实战：三层探针系统构建业务可理解的AI决策

Java八股-线程池与并发为什么总出问题

周新闻

第四章：本体推理的技术基础设施

OpenClaw：本地AI工作流的可编程调度中枢

3分钟打造你的游戏隐身衣：用Deceive重新掌控社交边界

月新闻

仅剩47小时！Gemini 2.5欧洲语言模型权重微调窗口即将关闭：3个轻量级LoRA适配器+1套验证集，零代码快速部署

【Gemini客户反馈分析实战指南】：20年AI产品专家亲授3大高价值洞察模型与落地工具包

Gemini用户差评聚类分析：3大隐性需求缺口暴露，错过本周将影响Q3产品迭代优先级

10102黄大年茶思屋榜文101期第2题低比特/低精度数据格式快速微调