Posts

把 Deep Research 做成可插拔能力：Agent Harness × AI-Q × MCP 架构图

把 Deep Research 做成可插拔能力：NVIDIA AI-Q Skill 对企业级 Agent 架构的启发

2026 年 5 月 20 日，NVIDIA 发布了一篇技术文章，介绍如何把 AI-Q 的深度研究能力包装成一个可被 Claude Code、Codex、OpenCode 等 agent harness 调用的“专用技能”。这篇文章的关键点不只是“又多了一个 AI 工具”，而是提出了一种更清晰的企业级 Agent 分层方式：让通用 agent harness 负责会话、工具编排、代码执行和用户交互，让专门的 research backend 负责多源检索、规划、综合、引用、评估和企业数据治理。(NVIDIA Developer) ...

阅读全文

腾讯 AI Leader 姚顺雨在这个PodCast中聊了什么？

本文围绕 Latent Space 对 Shunyu Yao 的访谈，梳理 ReAct、Reflexion、Tree of Thoughts、memory、benchmark、ACI 和 agent UX 等主题，并总结 AI agent 工程落地中工具、环境、评估与接口设计的重要性。

阅读全文

2026 年 AI Engineer 学什么值钱

本文从基础 RAG pipeline 被平台吸收的趋势出发，分析 2026 年 AI 应用工程师应该重点投入的高溢价技能，包括评估与可观测性、数据治理与权限控制，以及 agentic workflow 的深度工程能力。

阅读全文

把最重要的事放到身体最适合的时间：我的作息调整与时间利用手册

一份基于睡眠、昼夜节律和能量状态的个人作息调整手册，帮助把高价值任务安排到最适合的时间。

阅读全文

LLM 的“心口不一”: 理解 LLM 行为的一把万能钥匙

本文用 hidden state 与 token 之间的带宽鸿沟，统一解释 Chain of Thought、prompt 长度、few-shot、性格漂移与幻觉等 LLM 工程现象。

阅读全文

如何设计出优秀的 AI Agent：从架构原则到实战模式

本文系统梳理优秀 AI agent 系统的核心设计框架，包括 Spec-Driven Development、三层架构、Resolver、Latent 与 Deterministic 分界、Diarization 以及可自我进化的学习闭环，帮助工程师从补全工具思维转向 AI 增强软件工程。

阅读全文

AI Coding Agent 时代的核心技能：如何写好 Software Spec

本文结合 2025-2026 年 AI coding agent 与 Spec-Driven Development 的最新实践，系统解释 Software Spec 的定义、价值、核心组成、工作流与常见陷阱，并给出一份适用于 Claude Code、Codex CLI、Cursor 等工具的实战模板。

阅读全文

大模型训练全景：一个 AI 应用工程师需要理解的一切

从数据管线、Scaling Law、系统约束、合成数据、蒸馏、后训练、评估体系到 Agent 训练，系统梳理大模型训练全链路，并解释这些机制如何影响 AI 应用工程师的模型选型、评估与 harness 设计。

阅读全文

Agent-Native 文档工程：AI Coding Agent 驱动开发的文档体系设计指南

本文从 AI coding agent 的执行机制出发，系统解释 agent-native 文档为什么已经从“参考资料”变成“基础设施”，并给出 AGENTS.md、PRD、Architecture、Spec、Plan 等文档层级的职责划分与组织原则。文章也结合 Context Engineering 与 Spec-Driven Development 的实践，说明怎样设计一套既节省 context、又能稳定驱动 agent 行动的文档体系。

阅读全文

AI Agent 行业标准的全貌：一个 Java 工程师的视角

先看全景如果你是一个 Java 后端工程师，想快速理解 AI agent 领域当前的标准化格局，可以这样对标：通信/配置类型 AI Agent 标准 Java 类比发起方治理方采用状态 Agent ↔ 工具/数据 MCP JDBC Anthropic AAIF (Linux Foundation) ✅ 事实标准 Agent ↔ Agent A2A RMI / gRPC Google Linux Foundation ✅ 快速采用中项目规则配置 AGENTS.md application.yml OpenAI AAIF (Linux Foundation) ✅ 事实标准可复用能力包 SKILL.md Maven Plugin Anthropic agentskills.io（开放标准） ✅ 事实标准应用框架 Goose / Claude Agent SDK / ADK Spring Boot 各家部分归 AAIF 🔶 多家竞争微服务治理 Harness Engineering 体系 Spring Cloud — — 🔴 无标准测试/评估 Agent 评估框架 JUnit — — 🔴 无标准代码质量治理 Entropy 管理 SonarQube — — 🔴 无标准上半部分（✅）是已经形成行业共识或事实标准的部分，下半部分（🔶🔴）是尚在探索的前沿。本文主要讲清楚上半部分的全貌，然后展望下半部分的演进方向。 ...

阅读全文