大模型训练全景:一个 AI 应用工程师需要理解的一切

从数据管线、Scaling Law、系统约束、合成数据、蒸馏、后训练、评估体系到 Agent 训练,系统梳理大模型训练全链路,并解释这些机制如何影响 AI 应用工程师的模型选型、评估与 harness 设计。

2026-04-04 · 28 min · 13960 words · Andy SI
阅读全文

LLM 的 Agentic 化:从回答问题到自主工作

一个对比开始 你在 ChatGPT 里问"什么是 KV Cache",模型回答你,对话结束。 你在 Codex CLI 里说"给项目添加一个用户认证模块,包含测试",agent 开始自主工作:读取项目结构 → 理解现有代码 → 规划实现方案 → 编写认证逻辑 → 编写测试 → 运行测试 → 发现失败 → 修复 → 测试通过 → 提交 PR。整个过程可能经历几十步,你可能全程没有介入。 ...

2026-03-28 · 9 min · 4079 words · Andy SI
阅读全文

LLM 中的熵:从训练到推理到产品的统一语言

本文把交叉熵、Perplexity、Temperature、条件熵、幻觉检测和 Prompt 约束串成一条主线,解释熵如何成为理解 LLM 训练、推理和产品设计的统一语言。文章也从 RAG 和工程治理视角说明了熵的实际价值。

2026-03-27 · 6 min · 2590 words · Andy SI
阅读全文

Agent = Model + Harness

LangChain 对 Agent Harness 的拆解,把 context engineering、memory、MCP 与 agent loop 串成了一张完整地图。

2026-03-18 · 5 min · 2197 words · Andy SI
阅读全文

Prompt Engineering 完全最佳实践指南

一份面向 AI Application Engineer 的 Prompt Engineering 长文指南,覆盖基础原则、上下文设计、任务链、注入防御、Agent 提示设计与评估驱动开发。

2026-03-11 · 17 min · 8402 words · Andy SI
阅读全文

Apple M5 vs. M4: A Practical Comparison for AI Engineers

面向 AI 工程师,从 CPU、缓存、内存带宽到 Neural Accelerator,实战拆解 M5 相比 M4 在本地 LLM 与 Diffusion 推理中的性能意义。

2026-03-06 · 13 min · 6381 words · Andy SI
阅读全文

WHAT is LLM API KV Cache

KV Cache 是连接「Transformer 理论」和「LLM 工程部署」的一个关键概念。理解它,你就打通了从「模型怎么算」到「模型怎么跑」的最后一环。

2026-03-05 · 15 min · 7103 words · Andy SI
阅读全文

LLM Chain-of-Thought (CoT) 完全指南

理解什么是LLM Chain-of-Thought (CoT),以及如何进行 prompt engineering触发 LLM的Chain-of-Thought (CoT)

2026-03-04 · 11 min · 5059 words · Andy SI
阅读全文

Prompt Engineering从原理到实战

提示词工程?也许没有你想的那么简单。

2026-03-03 · 25 min · 12200 words · Andy SI
阅读全文

Prompt 注入

了解什么事 LLM的 Prompt注入,以及了解一些最近本的防御措施

2026-03-03 · 16 min · 7770 words · Andy SI
阅读全文