Posts

Anthropic Contextual Retrieval 阅读笔记

从 Anthropic Contextual Retrieval 原文与 Appendix II 出发，梳理其核心方法、实验结论，以及适合生产环境落地的 RAG 架构原则。

围绕 Contextual Retrieval、Context Engineering 与 RAG 评估整理的 10 篇高价值文章，覆盖 Anthropic 官方原文、开源实现教程与 2025 年趋势回顾。

面向 AI 工程师，从 CPU、缓存、内存带宽到 Neural Accelerator，实战拆解 M5 相比 M4 在本地 LLM 与 Diffusion 推理中的性能意义。

KV Cache 是连接「Transformer 理论」和「LLM 工程部署」的一个关键概念。理解它，你就打通了从「模型怎么算」到「模型怎么跑」的最后一环。

理解什么是LLM Chain-of-Thought (CoT)，以及如何进行 prompt engineering触发 LLM的Chain-of-Thought (CoT)

提示词工程？也许没有你想的那么简单。

了解什么事 LLM的 Prompt注入，以及了解一些最近本的防御措施

此文使我（也许也可以使你）更加深刻地理解transformer的基本原理，告别对当前主流LLM的黑箱式理解。cheers！