Posts

Agent = Model + Harness

LangChain 对 Agent Harness 的拆解，把 context engineering、memory、MCP 与 agent loop 串成了一张完整地图。

从并发与并行的基本区别讲起，系统梳理 Python 中 GIL、threading、multiprocessing、asyncio 与 concurrent.futures 的适用场景、协作方式与选型思路。

从单线程事件循环的“餐厅厨房”隐喻出发，系统梳理 Python 同步迭代、生成器、协程、异步生成器与线程池桥接之间的完整对应关系。

一份面向 AI Application Engineer 的 Prompt Engineering 长文指南，覆盖基础原则、上下文设计、任务链、注入防御、Agent 提示设计与评估驱动开发。

从 Anthropic Contextual Retrieval 原文与 Appendix II 出发，梳理其核心方法、实验结论，以及适合生产环境落地的 RAG 架构原则。

围绕 Contextual Retrieval、Context Engineering 与 RAG 评估整理的 10 篇高价值文章，覆盖 Anthropic 官方原文、开源实现教程与 2025 年趋势回顾。

面向 AI 工程师，从 CPU、缓存、内存带宽到 Neural Accelerator，实战拆解 M5 相比 M4 在本地 LLM 与 Diffusion 推理中的性能意义。

KV Cache 是连接「Transformer 理论」和「LLM 工程部署」的一个关键概念。理解它，你就打通了从「模型怎么算」到「模型怎么跑」的最后一环。

理解什么是LLM Chain-of-Thought (CoT)，以及如何进行 prompt engineering触发 LLM的Chain-of-Thought (CoT)

提示词工程？也许没有你想的那么简单。