RAG 不准怎么办:检索召回、重排与评估闭环落地指南

很多团队做 RAG 的第一反应是“把 embedding 换成更贵的模型”,结果成本上去了,效果却不稳定。真正的问题通常不在生成,而在检索链路:召回不全、排序不准、评估缺失。 这篇给一套可直接落地的做法:先把召回做厚,再把重排做准,最后用离线 + 在线指标形成持续优化闭环。 ...

February 17, 2026 · 3 min · mengboy