Anthropic Contextual Retrieval 阅读笔记
从 Anthropic Contextual Retrieval 原文与 Appendix II 出发,梳理其核心方法、实验结论,以及适合生产环境落地的 RAG 架构原则。
从 Anthropic Contextual Retrieval 原文与 Appendix II 出发,梳理其核心方法、实验结论,以及适合生产环境落地的 RAG 架构原则。
围绕 Contextual Retrieval、Context Engineering 与 RAG 评估整理的 10 篇高价值文章,覆盖 Anthropic 官方原文、开源实现教程与 2025 年趋势回顾。
面向 AI 工程师,从 CPU、缓存、内存带宽到 Neural Accelerator,实战拆解 M5 相比 M4 在本地 LLM 与 Diffusion 推理中的性能意义。
KV Cache 是连接「Transformer 理论」和「LLM 工程部署」的一个关键概念。理解它,你就打通了从「模型怎么算」到「模型怎么跑」的最后一环。
理解什么是LLM Chain-of-Thought (CoT),以及如何进行 prompt engineering触发 LLM的Chain-of-Thought (CoT)
提示词工程?也许没有你想的那么简单。
了解什么事 LLM的 Prompt注入,以及了解一些最近本的防御措施
此文使我(也许也可以使你)更加深刻地理解transformer的基本原理,告别对当前主流LLM的黑箱式理解。cheers!