Anthropic Contextual Retrieval 阅读笔记

从 Anthropic Contextual Retrieval 原文与 Appendix II 出发,梳理其核心方法、实验结论,以及适合生产环境落地的 RAG 架构原则。

2026-03-11 · 5 min · 2059 words · Andy SI
阅读全文

Contextual Retrieval + RAG 必读清单

围绕 Contextual Retrieval、Context Engineering 与 RAG 评估整理的 10 篇高价值文章,覆盖 Anthropic 官方原文、开源实现教程与 2025 年趋势回顾。

2026-03-09 · 4 min · 1558 words · Andy SI
阅读全文

Apple M5 vs. M4: A Practical Comparison for AI Engineers

面向 AI 工程师,从 CPU、缓存、内存带宽到 Neural Accelerator,实战拆解 M5 相比 M4 在本地 LLM 与 Diffusion 推理中的性能意义。

2026-03-06 · 13 min · 6381 words · Andy SI
阅读全文

WHAT is LLM API KV Cache

KV Cache 是连接「Transformer 理论」和「LLM 工程部署」的一个关键概念。理解它,你就打通了从「模型怎么算」到「模型怎么跑」的最后一环。

2026-03-05 · 15 min · 7103 words · Andy SI
阅读全文

LLM Chain-of-Thought (CoT) 完全指南

理解什么是LLM Chain-of-Thought (CoT),以及如何进行 prompt engineering触发 LLM的Chain-of-Thought (CoT)

2026-03-04 · 11 min · 5059 words · Andy SI
阅读全文

Prompt Engineering从原理到实战

提示词工程?也许没有你想的那么简单。

2026-03-03 · 25 min · 12200 words · Andy SI
阅读全文

Prompt 注入

了解什么事 LLM的 Prompt注入,以及了解一些最近本的防御措施

2026-03-03 · 16 min · 7770 words · Andy SI
阅读全文

理解 Transformer 的数学直觉

此文使我(也许也可以使你)更加深刻地理解transformer的基本原理,告别对当前主流LLM的黑箱式理解。cheers!

2026-02-24 · 15 min · 7302 words · Andy SI
阅读全文