WINSLOW Discover, learn and grow

RAG系统幻觉问题的诊断与优化

RAG是如何产生幻觉的 先看一个在实际系统中非常典型的场景。用户提问:“BM25 和 TF-IDF 的主要区别是什么?”系统返回了一段看似专业的回答,但其中出现了这样的描述:“BM25 在计算词频时采用平方项增强高频词的重要性”。从语言上看,这段回答没有明显问题,但如果你熟悉BM25算法,会立刻发现

ysf Published on 2026-04-09

如何评估RAG应用

在 Retrieval-Augmented Generation(RAG)系统中,模型性能不再仅取决于生成能力,还高度依赖检索质量与上下文利用效率。传统 NLP 评价指标(如 BLEU、ROUGE)已难以全面反映 RAG 系统的真实性与可用性。本文系统梳理 RAG 的评估范式,从检索层、生成层到端到端效果,详细解析关键评价指标,并对主流评估工具进行对比分析,最终给出可落地的评估实践方案。

ysf Published on 2025-12-09

RAG中的精确检索算法:从TF-IDF到BM25

在RAG(Retrieval-Augmented Generation)系统中,精确的检索算法是确保生成质量的关键。本文深入探讨了从经典的TF-IDF到现代BM25算法的演进,详细解析了BM25的数学原理、参数调优和实战应用,帮助开发者构建更高效的检索系统。

ysf Published on 2025-12-07