AI Coding Agent 时代的核心技能:如何写好 Software Spec

本文结合 2025-2026 年 AI coding agent 与 Spec-Driven Development 的最新实践,系统解释 Software Spec 的定义、价值、核心组成、工作流与常见陷阱,并给出一份适用于 Claude Code、Codex CLI、Cursor 等工具的实战模板。

2026-04-09 · 16 min · 7916 words · Andy SI
阅读全文

大模型训练全景:一个 AI 应用工程师需要理解的一切

从数据管线、Scaling Law、系统约束、合成数据、蒸馏、后训练、评估体系到 Agent 训练,系统梳理大模型训练全链路,并解释这些机制如何影响 AI 应用工程师的模型选型、评估与 harness 设计。

2026-04-04 · 28 min · 13960 words · Andy SI
阅读全文

Agent-Native 文档工程:AI Coding Agent 驱动开发的文档体系设计指南

本文从 AI coding agent 的执行机制出发,系统解释 agent-native 文档为什么已经从“参考资料”变成“基础设施”,并给出 AGENTS.md、PRD、Architecture、Spec、Plan 等文档层级的职责划分与组织原则。文章也结合 Context Engineering 与 Spec-Driven Development 的实践,说明怎样设计一套既节省 context、又能稳定驱动 agent 行动的文档体系。

2026-03-29 · 15 min · 7097 words · Andy SI
阅读全文

AI Agent 行业标准的全貌:一个 Java 工程师的视角

先看全景 如果你是一个 Java 后端工程师,想快速理解 AI agent 领域当前的标准化格局,可以这样对标: 通信/配置类型 AI Agent 标准 Java 类比 发起方 治理方 采用状态 Agent ↔ 工具/数据 MCP JDBC Anthropic AAIF (Linux Foundation) ✅ 事实标准 Agent ↔ Agent A2A RMI / gRPC Google Linux Foundation ✅ 快速采用中 项目规则配置 AGENTS.md application.yml OpenAI AAIF (Linux Foundation) ✅ 事实标准 可复用能力包 SKILL.md Maven Plugin Anthropic agentskills.io(开放标准) ✅ 事实标准 应用框架 Goose / Claude Agent SDK / ADK Spring Boot 各家 部分归 AAIF 🔶 多家竞争 微服务治理 Harness Engineering 体系 Spring Cloud — — 🔴 无标准 测试/评估 Agent 评估框架 JUnit — — 🔴 无标准 代码质量治理 Entropy 管理 SonarQube — — 🔴 无标准 上半部分(✅)是已经形成行业共识或事实标准的部分,下半部分(🔶🔴)是尚在探索的前沿。本文主要讲清楚上半部分的全貌,然后展望下半部分的演进方向。 ...

2026-03-28 · 14 min · 6570 words · Andy SI
阅读全文

LLM 的 Agentic 化:从回答问题到自主工作

一个对比开始 你在 ChatGPT 里问"什么是 KV Cache",模型回答你,对话结束。 你在 Codex CLI 里说"给项目添加一个用户认证模块,包含测试",agent 开始自主工作:读取项目结构 → 理解现有代码 → 规划实现方案 → 编写认证逻辑 → 编写测试 → 运行测试 → 发现失败 → 修复 → 测试通过 → 提交 PR。整个过程可能经历几十步,你可能全程没有介入。 ...

2026-03-28 · 9 min · 4079 words · Andy SI
阅读全文

如何为 AI Coding Agent 写文档

本文系统梳理了 OpenAI、Anthropic、HumanLayer 等团队在 AI coding agent 项目文档上的一线经验,解释为什么入口文件、分层知识库、状态追踪文件和局部文档会直接影响 agent 表现。文章也给出了从最小可行文档体系到持续维护机制的可落地实践路径。

2026-03-28 · 11 min · 5216 words · Andy SI
阅读全文

RAG 系统全景指南:从 0 到生产级的完整设计流程

本文面向正在学习 AI 应用工程的开发者,系统梳理了 RAG 从数据摄入、分块、检索、重排序、生成到评估与运维的完整链路。文章还给出了从最简可行方案到生产化落地的演进路径。

2026-03-27 · 15 min · 7181 words · Andy SI
阅读全文

LLM 中的熵:从训练到推理到产品的统一语言

本文把交叉熵、Perplexity、Temperature、条件熵、幻觉检测和 Prompt 约束串成一条主线,解释熵如何成为理解 LLM 训练、推理和产品设计的统一语言。文章也从 RAG 和工程治理视角说明了熵的实际价值。

2026-03-27 · 6 min · 2590 words · Andy SI
阅读全文

Spec-Driven Development 详解:从 Prompt and Pray 到 Spec and Steer

本文系统解释 Spec-Driven Development 的核心概念、四阶段工作流以及它与 vibe coding 的本质差异。结合当前工具生态与实践分层,说明为什么在 AI Coding Agent 时代,先写 spec 再实现能显著降低歧义和返工成本。

2026-03-19 · 9 min · 4418 words · Andy SI
阅读全文

RAG Chunking 最佳实践指导文档

基于多家机构的基准测试与行业实践,整理 RAG chunking 的默认配置、参数调优方法与不同文档类型下的策略选择。

2026-03-18 · 8 min · 3757 words · Andy SI
阅读全文