WINSLOW Discover, learn and grow

RAG系统幻觉问题的诊断与优化

RAG是如何产生幻觉的 先看一个在实际系统中非常典型的场景。用户提问:“BM25 和 TF-IDF 的主要区别是什么?”系统返回了一段看似专业的回答,但其中出现了这样的描述:“BM25 在计算词频时采用平方项增强高频词的重要性”。从语言上看,这段回答没有明显问题,但如果你熟悉BM25算法,会立刻发现

ysf Published on 2026-04-09

PageIndex

PageIndex是一个创新的“无向量、基于推理”的RAG框架,旨在解决传统RAG在处理长篇、结构化专业文档(如财务报告、法律文件、技术手册)时遇到的准确性不足和可解释性差等痛点。

ysf Published on 2026-04-03

Agent Skills 入门

Skill 的本质是一个文件夹,里面可以放脚本、数据、模板、配置,Claude 能发现、探索和操作这些文件。另外,Skill 还支持很多配置选项(详见官方文档的 frontmatter 参考),包括动态注册 Hook。

ysf Published on 2026-02-16

如何评估RAG应用

在 Retrieval-Augmented Generation(RAG)系统中,模型性能不再仅取决于生成能力,还高度依赖检索质量与上下文利用效率。传统 NLP 评价指标(如 BLEU、ROUGE)已难以全面反映 RAG 系统的真实性与可用性。本文系统梳理 RAG 的评估范式,从检索层、生成层到端到端效果,详细解析关键评价指标,并对主流评估工具进行对比分析,最终给出可落地的评估实践方案。

ysf Published on 2025-12-09

RAG中的精确检索算法:从TF-IDF到BM25

在RAG(Retrieval-Augmented Generation)系统中,精确的检索算法是确保生成质量的关键。本文深入探讨了从经典的TF-IDF到现代BM25算法的演进,详细解析了BM25的数学原理、参数调优和实战应用,帮助开发者构建更高效的检索系统。

ysf Published on 2025-12-07

Prompt Engineering 和 Context Engineering

2020年 OpenAI 发布了 GPT-3,引发了 Prompt Engineering(提示工程)这一全新领域的的兴起。 Prompt Engineering,顾名思义,就是如何通过设计合适的输入提示,充分挖掘大语言模型的潜力。 最近这段时间经常听到上下文工程这个词,在网上搜了点资料去了解了一下

ysf Published on 2025-10-06

大模型文本生成中 temperature 参数的数学机制

使用 API 接口调用大语言模型时,经常能看见 temperature 这个参数,阿里云白炼平台对 temperature 参数的解释是这样的: 那么 temperature 是如何影响大语言模型的输出结果的呢? 要理解 temperature 参数的作用,首先要理解大模型是生成文本时的决策过程。模

ysf Published on 2025-03-06

Prompt Engineering:提示词工程

提示词与提示词工程 提示词(Prompt)是与大语言模型或生成式AI进行交互时输入的指令或描述,它决定了模型输出的方向与质量。通俗地说,提示词就像与AI对话时的“问题”或“引导语”,而提示词工程(Prompt Engineering)就是设计、优化、组织这些提示词的系统化过程。 在不同任务中,提示词

ysf Published on 2024-12-09