把 Deep Research 做成可插拔能力:Agent Harness × AI-Q × MCP 架构图

把 Deep Research 做成可插拔能力:NVIDIA AI-Q Skill 对企业级 Agent 架构的启发

2026 年 5 月 20 日,NVIDIA 发布了一篇技术文章,介绍如何把 AI-Q 的深度研究能力包装成一个可被 Claude Code、Codex、OpenCode 等 agent harness 调用的“专用技能”。这篇文章的关键点不只是“又多了一个 AI 工具”,而是提出了一种更清晰的企业级 Agent 分层方式:让通用 agent harness 负责会话、工具编排、代码执行和用户交互,让专门的 research backend 负责多源检索、规划、综合、引用、评估和企业数据治理。(NVIDIA Developer) ...

2026-05-25 · 16 min · 7519 words · Andy SI
阅读全文

腾讯 AI Leader 姚顺雨 在这个PodCast中聊了什么?

本文围绕 Latent Space 对 Shunyu Yao 的访谈,梳理 ReAct、Reflexion、Tree of Thoughts、memory、benchmark、ACI 和 agent UX 等主题,并总结 AI agent 工程落地中工具、环境、评估与接口设计的重要性。

2026-05-24 · 12 min · 5981 words · Andy SI
阅读全文

2026 年 AI Engineer 学什么值钱

本文从基础 RAG pipeline 被平台吸收的趋势出发,分析 2026 年 AI 应用工程师应该重点投入的高溢价技能,包括评估与可观测性、数据治理与权限控制,以及 agentic workflow 的深度工程能力。

2026-05-03 · 15 min · 7362 words · Andy SI
阅读全文

把最重要的事放到身体最适合的时间:我的作息调整与时间利用手册

一份基于睡眠、昼夜节律和能量状态的个人作息调整手册,帮助把高价值任务安排到最适合的时间。

2026-05-03 · 11 min · 5337 words · Andy SI
阅读全文

LLM 的“心口不一”: 理解 LLM 行为的一把万能钥匙

本文用 hidden state 与 token 之间的带宽鸿沟,统一解释 Chain of Thought、prompt 长度、few-shot、性格漂移与幻觉等 LLM 工程现象。

2026-05-02 · 15 min · 7104 words · Andy SI
阅读全文

如何设计出优秀的 AI Agent:从架构原则到实战模式

本文系统梳理优秀 AI agent 系统的核心设计框架,包括 Spec-Driven Development、三层架构、Resolver、Latent 与 Deterministic 分界、Diarization 以及可自我进化的学习闭环,帮助工程师从补全工具思维转向 AI 增强软件工程。

2026-05-02 · 19 min · 9242 words · Andy SI
阅读全文

AI Coding Agent 时代的核心技能:如何写好 Software Spec

本文结合 2025-2026 年 AI coding agent 与 Spec-Driven Development 的最新实践,系统解释 Software Spec 的定义、价值、核心组成、工作流与常见陷阱,并给出一份适用于 Claude Code、Codex CLI、Cursor 等工具的实战模板。

2026-04-09 · 16 min · 7916 words · Andy SI
阅读全文

大模型训练全景:一个 AI 应用工程师需要理解的一切

从数据管线、Scaling Law、系统约束、合成数据、蒸馏、后训练、评估体系到 Agent 训练,系统梳理大模型训练全链路,并解释这些机制如何影响 AI 应用工程师的模型选型、评估与 harness 设计。

2026-04-04 · 28 min · 13960 words · Andy SI
阅读全文

Agent-Native 文档工程:AI Coding Agent 驱动开发的文档体系设计指南

本文从 AI coding agent 的执行机制出发,系统解释 agent-native 文档为什么已经从“参考资料”变成“基础设施”,并给出 AGENTS.md、PRD、Architecture、Spec、Plan 等文档层级的职责划分与组织原则。文章也结合 Context Engineering 与 Spec-Driven Development 的实践,说明怎样设计一套既节省 context、又能稳定驱动 agent 行动的文档体系。

2026-03-29 · 15 min · 7097 words · Andy SI
阅读全文

AI Agent 行业标准的全貌:一个 Java 工程师的视角

先看全景 如果你是一个 Java 后端工程师,想快速理解 AI agent 领域当前的标准化格局,可以这样对标: 通信/配置类型 AI Agent 标准 Java 类比 发起方 治理方 采用状态 Agent ↔ 工具/数据 MCP JDBC Anthropic AAIF (Linux Foundation) ✅ 事实标准 Agent ↔ Agent A2A RMI / gRPC Google Linux Foundation ✅ 快速采用中 项目规则配置 AGENTS.md application.yml OpenAI AAIF (Linux Foundation) ✅ 事实标准 可复用能力包 SKILL.md Maven Plugin Anthropic agentskills.io(开放标准) ✅ 事实标准 应用框架 Goose / Claude Agent SDK / ADK Spring Boot 各家 部分归 AAIF 🔶 多家竞争 微服务治理 Harness Engineering 体系 Spring Cloud — — 🔴 无标准 测试/评估 Agent 评估框架 JUnit — — 🔴 无标准 代码质量治理 Entropy 管理 SonarQube — — 🔴 无标准 上半部分(✅)是已经形成行业共识或事实标准的部分,下半部分(🔶🔴)是尚在探索的前沿。本文主要讲清楚上半部分的全貌,然后展望下半部分的演进方向。 ...

2026-03-28 · 14 min · 6570 words · Andy SI
阅读全文