第一梯队:必读(Anthropic 官方出品)

1. Anthropic: Contextual Retrieval 原文 https://www.anthropic.com/news/contextual-retrieval

这是 Contextual Retrieval 的原始提出文章,Anthropic 官方博客。文中详细介绍了 Contextual Embeddings 和 Contextual BM25 两种子技术,能将检索失败率降低 49%,配合 reranking 可降低 67%。还包含了关键的实用建议:当知识库小于 200,000 tokens(约 500 页)时,直接将整个知识库放进 prompt 即可,不需要 RAG。这篇是理解 Contextual Retrieval 的根基,其他所有文章都在引用它。

2. Anthropic: Context Engineering for Agents https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents

这是 Anthropic 2025 年发布的关于 Context Engineering 的深度文章。文中讨论了从预处理式检索向 “just in time” 按需检索的转变趋势——agent 不再预先检索所有数据,而是维护轻量标识符(文件路径、查询、链接),在运行时动态加载数据到 context 中。这篇是你学习计划中 Context Engineering 部分的核心参考。

3. Anthropic Claude Cookbooks(GitHub 仓库) https://github.com/anthropics/claude-cookbooks

官方代码示例仓库,提供了可直接复制使用的代码片段。其中与 RAG 直接相关的 notebook 包括:

  • third_party/Pinecone/rag_using_pinecone.ipynb — 用 Pinecone + Voyage AI 做 RAG
  • third_party/MongoDB/rag_using_mongodb.ipynb — 用 MongoDB 做 RAG
  • Contextual Embeddings 相关示例

4. Claude Cookbook 官方网站(新版) https://platform.claude.com/cookbook/

这是 Anthropic 新上线的 Cookbook 平台,比 GitHub 仓库更结构化,包含 prompting、tool use、multimodal 等完整分类。


第二梯队:高质量实现教程

5. Together AI: How To Implement Contextual RAG From Anthropic https://docs.together.ai/docs/how-to-implement-contextual-rag-from-anthropic

用完全开源模型逐行实现 Anthropic 的 Contextual Retrieval,包括用小型 1-3B 模型(Llama 3.2 3B)配合 prompt caching 来生成 chunk 上下文。适合你在手写阶段参考,因为它不依赖 Claude API,展示了用开源模型复现的完整流程。

6. LlamaIndex: Contextual Retrieval Cookbook https://docs.llamaindex.ai/en/stable/examples/cookbooks/contextual_retrieval/

LlamaIndex 官方实现的 Contextual Retrieval notebook,使用 Anthropic LLM 创建 chunk 上下文、OpenAI embedding、CohereAI Reranker,并对比了有无 contextual nodes 的检索效果。如果你后续想了解 LlamaIndex 框架,这是很好的入口。

7. Milvus: Contextual Retrieval with Milvus https://milvus.io/docs/contextual_retrieval_with_milvus.md

Milvus 向量数据库官方文档,展示了结合 dense-sparse 混合检索和 reranker 构建逐步增强的检索系统。文中还有一个很好的洞察:Contextual Retrieval 本质上是"文档增强"——就像 query rewriting 让查询更有信息量一样,用 LLM 预处理文档(清洗、补全丢失信息、摘要)能显著提升检索效果。


第三梯队:RAG 全景视野(进阶阅读)

8. RAGFlow: From RAG to Context — 2025 Year-end Review https://ragflow.io/blog/rag-review-2025-from-rag-to-context

这篇 2025 年末回顾文章指出了一个核心矛盾:企业感到"离不开 RAG,但又不满意 RAG"。文中全面梳理了 2025 年 RAG 领域的演变,包括 Long Context 能否替代 RAG 的实践检验、Context Engineering 作为独立领域的兴起、Memory 系统的关注度超越 RAG 等趋势。非常适合了解行业全局。

9. Evidently AI: A Complete Guide to RAG Evaluation https://www.evidentlyai.com/llm-guide/rag-evaluation

一份系统的 RAG 评估指南,覆盖开发和生产两个阶段的评估方法。包含检索评估(ranking metrics、relevance scoring)、生成评估(faithfulness、completeness)、以及用合成数据构建评估集的方法。你在 Month 2 做 RAG 评估时会直接用到。

10. AWS: Writing Best Practices to Optimize RAG Applications https://docs.aws.amazon.com/prescriptive-guidance/latest/writing-best-practices-rag/introduction.html

AWS 官方的 RAG 优化指南,重点在于如何从源文档层面优化 RAG 表现。这个角度很独特——大多数文章关注检索算法,这篇关注的是"喂给系统的文档本身应该怎么写才能让 RAG 效果更好"。视角很实用。


建议阅读顺序

对你当前阶段来说,我建议这个顺序:

  1. Anthropic Contextual Retrieval 原文 (#1)— 先理解核心概念
  2. Together AI 开源实现 (#5)— 看具体怎么用代码实现
  3. Anthropic Context Engineering for Agents (#2)— 理解更大的图景
  4. RAGFlow 2025 年末回顾 (#8)— 了解行业趋势和争议
  5. Evidently RAG 评估指南 (#9)— 为后续评估模块做准备

前两篇是当前最需要的,后三篇可以在正式进入 RAG 开发阶段(Month 2)时再精读。