AI Agent 行业标准的全貌：一个 Java 工程师的视角

先看全景

如果你是一个 Java 后端工程师，想快速理解 AI agent 领域当前的标准化格局，可以这样对标：

通信/配置类型	AI Agent 标准	Java 类比	发起方	治理方	采用状态
Agent ↔ 工具/数据	MCP	JDBC	Anthropic	AAIF (Linux Foundation)	✅ 事实标准
Agent ↔ Agent	A2A	RMI / gRPC	Google	Linux Foundation	✅ 快速采用中
项目规则配置	AGENTS.md	application.yml	OpenAI	AAIF (Linux Foundation)	✅ 事实标准
可复用能力包	SKILL.md	Maven Plugin	Anthropic	agentskills.io（开放标准）	✅ 事实标准
应用框架	Goose / Claude Agent SDK / ADK	Spring Boot	各家	部分归 AAIF	🔶 多家竞争
微服务治理	Harness Engineering 体系	Spring Cloud	—	—	🔴 无标准
测试/评估	Agent 评估框架	JUnit	—	—	🔴 无标准
代码质量治理	Entropy 管理	SonarQube	—	—	🔴 无标准

上半部分（✅）是已经形成行业共识或事实标准的部分，下半部分（🔶🔴）是尚在探索的前沿。本文主要讲清楚上半部分的全貌，然后展望下半部分的演进方向。

治理组织：AAIF

Agentic AI Foundation（AAIF） 是 Linux Foundation 下的一个定向基金，2025 年 12 月成立。它是 AI agent 领域的中立治理组织——确保核心基础设施在开放、透明、社区驱动的框架下演进，避免被任何单一厂商垄断。

Java 类比：AAIF 之于 AI agent，类似于 JCP（Java Community Process）之于 Java 生态。

创始阵容

三家联合发起：Anthropic（捐赠 MCP）、OpenAI（捐赠 AGENTS.md）、Block（捐赠 Goose）。支持成员包括 Google、Microsoft、AWS、Bloomberg、Cloudflare。截至 2026 年 2 月，已吸纳 97 家新成员，涵盖 JPMorgan Chase、American Express、Red Hat、Huawei、Lenovo、ServiceNow、UiPath 等。

Anthropic 和 OpenAI 通常互为竞争对手，但愿意坐到同一张桌子前——这说明行业对"需要开放标准"已有共识。就像当年 Sun、IBM、Oracle 虽然互相竞争，但都在 JCP 框架下共同推进 Java 标准。

治理结构

Linux Foundation 标准的开放治理模式：成员通过会费参与，但资金不等于控制权。项目路线图由技术指导委员会（TSC）决定，任何单一成员都没有单方面决定方向的权力。项目捐赠给基金会后，原始作者不再独占控制权，社区共同决定演进方向——和 Apache Software Foundation 管理 Kafka、Spark 的方式相同。

需要注意： AAIF 并不管辖所有 AI agent 标准。A2A 和 SKILL.md 就不在 AAIF 创始项目中（A2A 单独捐给了 Linux Foundation，SKILL.md 作为独立开放标准运营）。AAIF 目前管辖的创始项目是 MCP、AGENTS.md 和 Goose。

第一层标准：Agent 怎么连接工具和数据（MCP）

MCP — “AI 世界的 JDBC”

Model Context Protocol。Anthropic 于 2024 年 11 月开源，2025 年 12 月捐赠给 AAIF。

MCP 解决的核心问题：AI agent 怎么连接外部工具和数据源？

在 MCP 之前，每个 AI 工具想连接一个外部服务（GitHub、Slack、数据库……），都要写定制集成。M 个 AI 工具 × N 个外部服务 = M×N 个适配器。MCP 定义了通用协议：AI 应用（MCP Client）通过标准接口连接 MCP Server，每个 MCP Server 封装了对一个外部服务的访问。M + N 个适配替代 M×N。

Java 类比：就是 JDBC。 JDBC 定义了 Java 应用连接数据库的标准接口，不管你用 MySQL 还是 PostgreSQL，Java 代码通过同一套 API 操作，具体驱动各厂商提供。MCP 做的完全相同——“数据库"变成"任何外部工具和数据源”，“Java 应用"变成"任何 AI agent”。

当前规模： 10,000+ 个已发布 MCP Server。Python 和 TypeScript 官方 SDK 月下载量超 9700 万次。已被 Claude、ChatGPT、Gemini、Cursor、Microsoft Copilot 等主流产品采用。

第二层标准：Agent 之间怎么通信（A2A）

A2A — “AI 世界的 gRPC”

Agent2Agent Protocol。Google 于 2025 年 4 月发布，2025 年 6 月捐赠给 Linux Foundation。

A2A 解决的核心问题：多个 agent 之间怎么互相发现、通信和协作？

MCP 解决的是 agent-to-tool（agent 怎么用工具），A2A 解决的是 agent-to-agent（agent 怎么和其他 agent 对话）。两者是互补关系，不是竞争关系。

用一个具体场景说明两者的区别： 零售企业的库存 agent 用 MCP 连接数据库查询库存水平（agent-to-tool）。当发现某商品库存不足时，它通过 A2A 协议联系外部供应商的采购 agent 下订单（agent-to-agent）。MCP 是 agent 的"手"（操作工具），A2A 是 agent 的"嘴"（和其他 agent 对话）。

Java 类比：A2A 类似于 gRPC 或 RMI。 它定义了分布式环境中服务（agent）之间的通信协议——怎么发现对方、怎么描述自己的能力、怎么发起请求和接收响应。

A2A 的核心机制

Agent Card： 每个 A2A agent 在一个固定 URL（/.well-known/agent-card.json）发布一个 JSON 文件，描述自己的名称、能力、端点地址和认证要求。这类似于 OpenAPI 的服务描述——让其他 agent 能发现并了解你。

基于现有 Web 标准： A2A 构建在 HTTP、JSON-RPC、SSE 之上，不发明新的传输层。这和 Java 世界中 gRPC 基于 HTTP/2 + Protocol Buffers 的策略一样——降低采用门槛，利用现有基础设施。

不透明协作（Opaque Agents）： Agent 之间协作时不需要暴露内部记忆、私有逻辑或工具实现。这保护了数据隐私和知识产权。这一点和微服务架构的"黑盒"原则一致——你只关心接口契约，不关心对方内部实现。

异步任务生命周期： A2A 定义了结构化的 Task 对象，有 submitted → working → input-required → completed 等生命周期状态。支持长时间运行的异步操作——agent 之间的协作可能跨越几小时甚至几天。

当前规模： 150+ 家组织支持，包括 Salesforce、ServiceNow、Atlassian、SAP、Adobe 等企业级巨头。已有 Python SDK，ADK（Google 的 Agent Development Kit）原生集成。2026 年 3 月发布了 v0.3 版本，新增 gRPC 支持和安全卡签名。

第三层标准：怎么告诉 Agent 项目规则（AGENTS.md）

AGENTS.md — “AI 世界的 application.yml”

OpenAI 于 2025 年 8 月发布，2025 年 12 月捐赠给 AAIF。

AGENTS.md 解决的核心问题：怎么告诉 AI coding agent 一个项目的规则、约束和工作方式？

它是一个基于 Markdown 的约定：在项目根目录（和子目录）放置 AGENTS.md 文件，内容包含构建命令、测试方式、编码规范、项目结构、安全边界等。AI coding agent 启动时自动读取并注入 context。

Java 类比：application.yml。 Spring Boot 启动时自动读取 application.yml，框架硬编码了这个行为。AGENTS.md 的机制完全一样——工具的代码硬编码了"启动时找到并读取这个文件"，模型本身并不"知道"这是约束文件，它只是看到了一段被注入的文字，然后作为指令遵循。

子目录覆盖： 子目录的 AGENTS.md 可以覆盖父目录的规则，就像 Spring Boot 中 application-dev.yml 覆盖 application.yml 一样。Agent 自动读取目录树中最近的文件。OpenAI 自己的主仓库有 88 个 AGENTS.md 文件。

之前的碎片化： Claude Code 用 CLAUDE.md，Cursor 用 .cursorrules，GitHub Copilot 用 copilot-instructions.md。AGENTS.md 的目标是统一这些——就像 Maven 的 pom.xml 统一了之前各自为政的构建配置。

当前规模： 60,000+ 个开源项目采用。Codex、Cursor、GitHub Copilot、Gemini CLI、Devin、VS Code 等主流工具已支持。

第四层标准：Agent 的可复用能力包（SKILL.md）

SKILL.md — “AI 世界的 Maven Plugin”

Anthropic 于 2025 年 10 月发起，2025 年 12 月作为开放标准发布。托管在 agentskills.io。

SKILL.md 解决的核心问题：怎么把 agent 的能力封装成可复用、可分发、跨工具通用的"能力包"？

AGENTS.md 定义"这个项目的规则是什么"（项目级配置），SKILL.md 定义"agent 能做什么事、怎么做"（可插拔能力）。前者是静态约束，后者是动态能力。

Java 类比：Maven Plugin。 Maven Plugin 是标准化的、可复用的构建能力包——maven-compiler-plugin 负责编译，maven-surefire-plugin 负责测试。你不需要为每个项目重写编译逻辑，引入插件即可。SKILL.md 做的是同样的事——frontend-design skill 负责高质量前端设计，code-reviewer skill 负责代码审查。一次编写，跨工具复用。

SKILL.md 的结构

my-skill/
├── SKILL.md        ← 必需：YAML 元数据 + Markdown 指令
├── scripts/        ← 可选：可执行脚本
├── references/     ← 可选：参考文档
└── assets/         ← 可选：模板、资源文件

精妙的三级渐进式披露

这是 SKILL.md 设计中最聪明的地方：

阶段	时机	加载内容	Token 消耗
发现（Advertise）	Agent 启动时	仅 name + description	~50 token/skill
激活（Activate）	任务匹配时	完整 SKILL.md 正文	~500-5000 token
执行（Execute）	需要时	scripts/、references/ 等	按需加载

安装 20 个 skill，启动时只消耗约 1000 token 的元数据目录。只有被触发的那个 skill 才加载完整指令。和把所有规则塞进一个大 AGENTS.md 相比，这是数量级的 context 效率提升。

调用方式分两种： 显式调用（Claude Code 中 /skill-name，Codex 中 $skill-name）和隐式调用（你描述任务，agent 自动匹配最相关的 skill 并激活）。

当前规模： 16+ 个主流工具支持（Claude Code、Cursor、Codex、Gemini CLI、GitHub Copilot、VS Code、JetBrains Junie 等）。社区已有 1,234+ 个可用 skill。官方 frontend-design skill 单个 277,000+ 次安装。

安全注意： Cisco AI Defense 团队在 2026 年 2 月发现 341 个恶意 skill，包含提示注入和凭证窃取。安装社区 skill 时需要像审查 npm 包一样谨慎。

四层标准如何协同工作

这四个标准不是竞争关系，而是分层互补的。用一个完整场景串起来：

你在一个电商项目中使用 AI coding agent。Agent 启动时读取 AGENTS.md，了解项目用 Python + FastAPI + PostgreSQL，测试用 pytest，绝不允许提交密钥。
Agent 需要写一个商品推荐功能。它发现已安装的 SKILL.md 中有一个 api-design skill 匹配当前任务，自动激活并按照 skill 定义的 RESTful 设计规范来编写 API。
实现过程中，agent 需要查询商品数据库和调用推荐模型 API。它通过 MCP 连接 PostgreSQL MCP Server 读取商品数据，连接推荐模型的 MCP Server 获取推荐结果。
推荐功能上线后，库存 agent 发现某热门商品库存不足。它通过 A2A 协议联系供应商的采购 agent，协商价格并下补货订单。

四层各司其职：AGENTS.md 管"规则"，SKILL.md 管"能力"，MCP 管"连接工具"，A2A 管"agent 间协作"。

用 Java 架构对标：

A2A    ←→  gRPC / RMI        （服务间通信）
MCP    ←→  JDBC / JPA         （数据/工具访问）
SKILL.md ←→  Maven Plugin     （可复用能力包）
AGENTS.md ←→  application.yml （项目配置）

还在探索中的领域

已标准化的四层解决了基础管道问题。但一个完整的 agent 工程体系远不止这些。以下领域尚无行业标准，处于各家独立探索阶段：

文档分层架构 — “没有 Spring Boot 自动配置”

OpenAI 提出了分层文档结构（短入口 → 渐进式披露 → 分层 docs/ 目录）。Anthropic 提出了 initializer agent + progress file 方案。两者趋同但都是经验分享，不是标准规范。

架构约束的机械化执行 — “没有 ArchUnit”

OpenAI 用自定义 linter 执行分层架构规则，error message 包含修复指引。但没有通用的 agent 架构约束框架。每个团队都在写自己的 linter。

Agent 评估体系 — “没有 JUnit”

Anthropic 用 Playwright 端到端测试评估 agent 生成的代码，发现"生成和评估必须分离"。但没有标准化的评估框架。

代码质量自动治理 — “没有 SonarQube”

OpenAI 用 garbage collection agent 对抗代码库熵增。但"代码库熵管理"甚至还没成为被广泛认知的工程概念。

跨会话状态管理 — “没有 Spring Session”

Anthropic 用 progress file + JSON feature list + git history。OpenAI 用版本化执行计划。各家用各种 ad-hoc 方案传递跨会话状态。

安全护栏 — “没有 Spring Security”

Anthropic 的 Claude Code auto mode（两阶段分类器 + 注入检测）是目前最完整的公开方案，但它是 Claude Code 专有实现，不是通用标准。

标准化的演进路径预测

基于 Java 生态的历史经验，AI agent 标准化可能沿以下路径演进：

第一阶段（当前 2025-2026）：协议和格式标准化。 对标 Java 的 JDBC + Servlet 规范。MCP、A2A、AGENTS.md、SKILL.md 已经完成了这一步。这是最基础的层面——定义"接口"，让不同实现可以互操作。

第二阶段（预计 2026-2027）：框架层标准化。 对标 Spring Framework 的出现。当前 Goose、Claude Agent SDK、Google ADK、LangGraph 等框架在竞争中。最终可能出现少数几个主流框架，内置对四层标准的支持，并提供文档分层、状态管理、安全护栏等上层抽象。

第三阶段（预计 2027+）：治理和运维标准化。 对标 Spring Cloud + SonarQube + ArchUnit。架构约束框架、评估标准、代码质量治理、可观测性集成规范逐渐固化为工具和标准。

这个路径不是确定的——AI 领域的演化速度远快于 Java 生态当年。但底层逻辑相同：先标准化接口（让系统能互通），再标准化框架（让开发更高效），最后标准化治理（让运维更可靠）。

生态全景图

最后把所有标准和治理关系放到一张图中：

┌─────────────────────────────────────────────────────────┐
│                    Linux Foundation                      │
│                                                         │
│   ┌──── AAIF ────────────────┐    ┌──────────────────┐  │
│   │  • MCP (Anthropic)       │    │  A2A (Google)     │  │
│   │  • AGENTS.md (OpenAI)    │    │  独立项目         │  │
│   │  • Goose (Block)         │    │                   │  │
│   └──────────────────────────┘    └──────────────────┘  │
│                                                         │
└─────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────┐
│               独立开放标准（非 Linux Foundation）          │
│                                                         │
│   • SKILL.md (Anthropic → agentskills.io)               │
│   • ACP (IBM BeeAI) — 早期，agent 消息传递              │
│   • UCP (Google) — 早期，agent 商业交易                  │
│                                                         │
└─────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────┐
│               尚无标准，各家探索中                         │
│                                                         │
│   • 文档分层架构        (OpenAI/Anthropic 有实践参考)     │
│   • 架构约束机械化执行   (OpenAI 有自定义 linter 实践)     │
│   • Agent 评估体系      (Anthropic 有 E2E 测试方案)      │
│   • 代码质量治理         (OpenAI 有 entropy 管理实践)     │
│   • 跨会话状态管理       (Anthropic 有 progress file 方案)│
│   • 安全护栏            (Anthropic 有 auto mode 方案)    │
│                                                         │
└─────────────────────────────────────────────────────────┘

对你的实际意义

如果你正在转型 AI 应用工程，这张全景图对你有四个直接指导：

① MCP 是最确定的投资方向。 事实标准，AAIF 中立治理，所有主流工具采用。学 MCP Server 开发不会浪费——就像 2005 年学 JDBC 不会浪费。

② A2A 是下一个该关注的协议。 当你的项目从单 agent 演化到多 agent 协作时（比如 hey!stalker 的多阶段愿景），A2A 就是 agent 间通信的标准方式。现在不需要深入，但需要知道它的存在和设计哲学。

③ SKILL.md 是提升日常效率的即时工具。 你现在就可以安装和使用社区 skill，也可以为自己的常见工作流编写自定义 skill。投入产出比很高。

④ 上层实践（Harness Engineering）是真正的竞争力。 恰恰因为文档分层、架构约束、评估体系、entropy 管理等领域还没有标准化，懂得怎么做这些事的人就是稀缺资源。 而你 7 年的 Java 后端经验（分层架构、依赖管理、CI/CD、代码审查）恰好是这些能力的基础。

一句话总结

AI agent 标准生态正在以惊人的速度分层成型：MCP 管连接、A2A 管通信、AGENTS.md 管配置、SKILL.md 管能力——基础管道的互操作性问题已基本解决。但更高层的工程实践——文档架构、约束执行、评估体系、质量治理——仍是各家探索的前沿。标准的下半场还没开始，你有机会成为定义者而非追随者。

参考来源：

Linux Foundation, “Announces the Formation of the Agentic AI Foundation (AAIF)”, 2025.12
Google Developers Blog, “Announcing the Agent2Agent Protocol (A2A)”, 2025.04
Google Cloud Blog, “Agent2Agent Protocol Is Getting an Upgrade”, 2025.07
OpenAI, “OpenAI Co-founds the Agentic AI Foundation”, 2025.12
Anthropic, “Donating the Model Context Protocol and Establishing the AAIF”, 2025.12
Agent Skills 官方站, agentskills.io
Google Developers Blog, “Developer’s Guide to AI Agent Protocols”, 2026.03
Digital Applied, “AI Agent Protocol Ecosystem Map 2026”, 2026.03
IBM, “What Is Agent2Agent (A2A) Protocol?”, 2025.11
TechCrunch, “OpenAI, Anthropic, and Block Join New Linux Foundation Effort”, 2025.12
Serenities AI, “AI Agent Skills Guide 2026”, 2026.03

先看全景#

治理组织：AAIF#

创始阵容#

治理结构#

第一层标准：Agent 怎么连接工具和数据（MCP）#

MCP — “AI 世界的 JDBC”#

第二层标准：Agent 之间怎么通信（A2A）#

A2A — “AI 世界的 gRPC”#

A2A 的核心机制#

第三层标准：怎么告诉 Agent 项目规则（AGENTS.md）#

AGENTS.md — “AI 世界的 application.yml”#

第四层标准：Agent 的可复用能力包（SKILL.md）#

SKILL.md — “AI 世界的 Maven Plugin”#

SKILL.md 的结构#

精妙的三级渐进式披露#

四层标准如何协同工作#

还在探索中的领域#

文档分层架构 — “没有 Spring Boot 自动配置”#

架构约束的机械化执行 — “没有 ArchUnit”#

Agent 评估体系 — “没有 JUnit”#

代码质量自动治理 — “没有 SonarQube”#

跨会话状态管理 — “没有 Spring Session”#

安全护栏 — “没有 Spring Security”#

标准化的演进路径预测#

生态全景图#

对你的实际意义#

一句话总结#