RAG 已经触及了天花板,而 RL 训练的智能体刚刚超越了它。 一段时间内,我们只需通过更好的嵌入和重新排序器就能持续改进检索。当时的最佳实践相对简单:通常你会进行稀疏搜索(BM25/SPLADE),密集嵌入搜索,然后使用 RRF(互逆排名融合) 或交叉编码器进行重新排序。这已经足够将搜索质量提升……

阅读全文