先看全景
如果你是一个 Java 后端工程师,想快速理解 AI agent 领域当前的标准化格局,可以这样对标:
| 通信/配置类型 | AI Agent 标准 | Java 类比 | 发起方 | 治理方 | 采用状态 |
|---|---|---|---|---|---|
| Agent ↔ 工具/数据 | MCP | JDBC | Anthropic | AAIF (Linux Foundation) | ✅ 事实标准 |
| Agent ↔ Agent | A2A | RMI / gRPC | Linux Foundation | ✅ 快速采用中 | |
| 项目规则配置 | AGENTS.md | application.yml | OpenAI | AAIF (Linux Foundation) | ✅ 事实标准 |
| 可复用能力包 | SKILL.md | Maven Plugin | Anthropic | agentskills.io(开放标准) | ✅ 事实标准 |
| 应用框架 | Goose / Claude Agent SDK / ADK | Spring Boot | 各家 | 部分归 AAIF | 🔶 多家竞争 |
| 微服务治理 | Harness Engineering 体系 | Spring Cloud | — | — | 🔴 无标准 |
| 测试/评估 | Agent 评估框架 | JUnit | — | — | 🔴 无标准 |
| 代码质量治理 | Entropy 管理 | SonarQube | — | — | 🔴 无标准 |
上半部分(✅)是已经形成行业共识或事实标准的部分,下半部分(🔶🔴)是尚在探索的前沿。本文主要讲清楚上半部分的全貌,然后展望下半部分的演进方向。
治理组织:AAIF
Agentic AI Foundation(AAIF) 是 Linux Foundation 下的一个定向基金,2025 年 12 月成立。它是 AI agent 领域的中立治理组织——确保核心基础设施在开放、透明、社区驱动的框架下演进,避免被任何单一厂商垄断。
Java 类比:AAIF 之于 AI agent,类似于 JCP(Java Community Process)之于 Java 生态。
创始阵容
三家联合发起:Anthropic(捐赠 MCP)、OpenAI(捐赠 AGENTS.md)、Block(捐赠 Goose)。支持成员包括 Google、Microsoft、AWS、Bloomberg、Cloudflare。截至 2026 年 2 月,已吸纳 97 家新成员,涵盖 JPMorgan Chase、American Express、Red Hat、Huawei、Lenovo、ServiceNow、UiPath 等。
Anthropic 和 OpenAI 通常互为竞争对手,但愿意坐到同一张桌子前——这说明行业对"需要开放标准"已有共识。就像当年 Sun、IBM、Oracle 虽然互相竞争,但都在 JCP 框架下共同推进 Java 标准。
治理结构
Linux Foundation 标准的开放治理模式:成员通过会费参与,但资金不等于控制权。项目路线图由技术指导委员会(TSC)决定,任何单一成员都没有单方面决定方向的权力。项目捐赠给基金会后,原始作者不再独占控制权,社区共同决定演进方向——和 Apache Software Foundation 管理 Kafka、Spark 的方式相同。
需要注意: AAIF 并不管辖所有 AI agent 标准。A2A 和 SKILL.md 就不在 AAIF 创始项目中(A2A 单独捐给了 Linux Foundation,SKILL.md 作为独立开放标准运营)。AAIF 目前管辖的创始项目是 MCP、AGENTS.md 和 Goose。
第一层标准:Agent 怎么连接工具和数据(MCP)
MCP — “AI 世界的 JDBC”
Model Context Protocol。Anthropic 于 2024 年 11 月开源,2025 年 12 月捐赠给 AAIF。
MCP 解决的核心问题:AI agent 怎么连接外部工具和数据源?
在 MCP 之前,每个 AI 工具想连接一个外部服务(GitHub、Slack、数据库……),都要写定制集成。M 个 AI 工具 × N 个外部服务 = M×N 个适配器。MCP 定义了通用协议:AI 应用(MCP Client)通过标准接口连接 MCP Server,每个 MCP Server 封装了对一个外部服务的访问。M + N 个适配替代 M×N。
Java 类比:就是 JDBC。 JDBC 定义了 Java 应用连接数据库的标准接口,不管你用 MySQL 还是 PostgreSQL,Java 代码通过同一套 API 操作,具体驱动各厂商提供。MCP 做的完全相同——“数据库"变成"任何外部工具和数据源”,“Java 应用"变成"任何 AI agent”。
当前规模: 10,000+ 个已发布 MCP Server。Python 和 TypeScript 官方 SDK 月下载量超 9700 万次。已被 Claude、ChatGPT、Gemini、Cursor、Microsoft Copilot 等主流产品采用。
第二层标准:Agent 之间怎么通信(A2A)
A2A — “AI 世界的 gRPC”
Agent2Agent Protocol。Google 于 2025 年 4 月发布,2025 年 6 月捐赠给 Linux Foundation。
A2A 解决的核心问题:多个 agent 之间怎么互相发现、通信和协作?
MCP 解决的是 agent-to-tool(agent 怎么用工具),A2A 解决的是 agent-to-agent(agent 怎么和其他 agent 对话)。两者是互补关系,不是竞争关系。
用一个具体场景说明两者的区别: 零售企业的库存 agent 用 MCP 连接数据库查询库存水平(agent-to-tool)。当发现某商品库存不足时,它通过 A2A 协议联系外部供应商的采购 agent 下订单(agent-to-agent)。MCP 是 agent 的"手"(操作工具),A2A 是 agent 的"嘴"(和其他 agent 对话)。
Java 类比:A2A 类似于 gRPC 或 RMI。 它定义了分布式环境中服务(agent)之间的通信协议——怎么发现对方、怎么描述自己的能力、怎么发起请求和接收响应。
A2A 的核心机制
Agent Card: 每个 A2A agent 在一个固定 URL(/.well-known/agent-card.json)发布一个 JSON 文件,描述自己的名称、能力、端点地址和认证要求。这类似于 OpenAPI 的服务描述——让其他 agent 能发现并了解你。
基于现有 Web 标准: A2A 构建在 HTTP、JSON-RPC、SSE 之上,不发明新的传输层。这和 Java 世界中 gRPC 基于 HTTP/2 + Protocol Buffers 的策略一样——降低采用门槛,利用现有基础设施。
不透明协作(Opaque Agents): Agent 之间协作时不需要暴露内部记忆、私有逻辑或工具实现。这保护了数据隐私和知识产权。这一点和微服务架构的"黑盒"原则一致——你只关心接口契约,不关心对方内部实现。
异步任务生命周期: A2A 定义了结构化的 Task 对象,有 submitted → working → input-required → completed 等生命周期状态。支持长时间运行的异步操作——agent 之间的协作可能跨越几小时甚至几天。
当前规模: 150+ 家组织支持,包括 Salesforce、ServiceNow、Atlassian、SAP、Adobe 等企业级巨头。已有 Python SDK,ADK(Google 的 Agent Development Kit)原生集成。2026 年 3 月发布了 v0.3 版本,新增 gRPC 支持和安全卡签名。
第三层标准:怎么告诉 Agent 项目规则(AGENTS.md)
AGENTS.md — “AI 世界的 application.yml”
OpenAI 于 2025 年 8 月发布,2025 年 12 月捐赠给 AAIF。
AGENTS.md 解决的核心问题:怎么告诉 AI coding agent 一个项目的规则、约束和工作方式?
它是一个基于 Markdown 的约定:在项目根目录(和子目录)放置 AGENTS.md 文件,内容包含构建命令、测试方式、编码规范、项目结构、安全边界等。AI coding agent 启动时自动读取并注入 context。
Java 类比:application.yml。 Spring Boot 启动时自动读取 application.yml,框架硬编码了这个行为。AGENTS.md 的机制完全一样——工具的代码硬编码了"启动时找到并读取这个文件",模型本身并不"知道"这是约束文件,它只是看到了一段被注入的文字,然后作为指令遵循。
子目录覆盖: 子目录的 AGENTS.md 可以覆盖父目录的规则,就像 Spring Boot 中 application-dev.yml 覆盖 application.yml 一样。Agent 自动读取目录树中最近的文件。OpenAI 自己的主仓库有 88 个 AGENTS.md 文件。
之前的碎片化: Claude Code 用 CLAUDE.md,Cursor 用 .cursorrules,GitHub Copilot 用 copilot-instructions.md。AGENTS.md 的目标是统一这些——就像 Maven 的 pom.xml 统一了之前各自为政的构建配置。
当前规模: 60,000+ 个开源项目采用。Codex、Cursor、GitHub Copilot、Gemini CLI、Devin、VS Code 等主流工具已支持。
第四层标准:Agent 的可复用能力包(SKILL.md)
SKILL.md — “AI 世界的 Maven Plugin”
Anthropic 于 2025 年 10 月发起,2025 年 12 月作为开放标准发布。托管在 agentskills.io。
SKILL.md 解决的核心问题:怎么把 agent 的能力封装成可复用、可分发、跨工具通用的"能力包"?
AGENTS.md 定义"这个项目的规则是什么"(项目级配置),SKILL.md 定义"agent 能做什么事、怎么做"(可插拔能力)。前者是静态约束,后者是动态能力。
Java 类比:Maven Plugin。 Maven Plugin 是标准化的、可复用的构建能力包——maven-compiler-plugin 负责编译,maven-surefire-plugin 负责测试。你不需要为每个项目重写编译逻辑,引入插件即可。SKILL.md 做的是同样的事——frontend-design skill 负责高质量前端设计,code-reviewer skill 负责代码审查。一次编写,跨工具复用。
SKILL.md 的结构
my-skill/
├── SKILL.md ← 必需:YAML 元数据 + Markdown 指令
├── scripts/ ← 可选:可执行脚本
├── references/ ← 可选:参考文档
└── assets/ ← 可选:模板、资源文件
精妙的三级渐进式披露
这是 SKILL.md 设计中最聪明的地方:
| 阶段 | 时机 | 加载内容 | Token 消耗 |
|---|---|---|---|
| 发现(Advertise) | Agent 启动时 | 仅 name + description | ~50 token/skill |
| 激活(Activate) | 任务匹配时 | 完整 SKILL.md 正文 | ~500-5000 token |
| 执行(Execute) | 需要时 | scripts/、references/ 等 | 按需加载 |
安装 20 个 skill,启动时只消耗约 1000 token 的元数据目录。只有被触发的那个 skill 才加载完整指令。和把所有规则塞进一个大 AGENTS.md 相比,这是数量级的 context 效率提升。
调用方式分两种: 显式调用(Claude Code 中 /skill-name,Codex 中 $skill-name)和隐式调用(你描述任务,agent 自动匹配最相关的 skill 并激活)。
当前规模: 16+ 个主流工具支持(Claude Code、Cursor、Codex、Gemini CLI、GitHub Copilot、VS Code、JetBrains Junie 等)。社区已有 1,234+ 个可用 skill。官方 frontend-design skill 单个 277,000+ 次安装。
安全注意: Cisco AI Defense 团队在 2026 年 2 月发现 341 个恶意 skill,包含提示注入和凭证窃取。安装社区 skill 时需要像审查 npm 包一样谨慎。
四层标准如何协同工作
这四个标准不是竞争关系,而是分层互补的。用一个完整场景串起来:
你在一个电商项目中使用 AI coding agent。Agent 启动时读取 AGENTS.md,了解项目用 Python + FastAPI + PostgreSQL,测试用 pytest,绝不允许提交密钥。
Agent 需要写一个商品推荐功能。它发现已安装的 SKILL.md 中有一个
api-designskill 匹配当前任务,自动激活并按照 skill 定义的 RESTful 设计规范来编写 API。实现过程中,agent 需要查询商品数据库和调用推荐模型 API。它通过 MCP 连接 PostgreSQL MCP Server 读取商品数据,连接推荐模型的 MCP Server 获取推荐结果。
推荐功能上线后,库存 agent 发现某热门商品库存不足。它通过 A2A 协议联系供应商的采购 agent,协商价格并下补货订单。
四层各司其职:AGENTS.md 管"规则",SKILL.md 管"能力",MCP 管"连接工具",A2A 管"agent 间协作"。
用 Java 架构对标:
A2A ←→ gRPC / RMI (服务间通信)
MCP ←→ JDBC / JPA (数据/工具访问)
SKILL.md ←→ Maven Plugin (可复用能力包)
AGENTS.md ←→ application.yml (项目配置)
还在探索中的领域
已标准化的四层解决了基础管道问题。但一个完整的 agent 工程体系远不止这些。以下领域尚无行业标准,处于各家独立探索阶段:
文档分层架构 — “没有 Spring Boot 自动配置”
OpenAI 提出了分层文档结构(短入口 → 渐进式披露 → 分层 docs/ 目录)。Anthropic 提出了 initializer agent + progress file 方案。两者趋同但都是经验分享,不是标准规范。
架构约束的机械化执行 — “没有 ArchUnit”
OpenAI 用自定义 linter 执行分层架构规则,error message 包含修复指引。但没有通用的 agent 架构约束框架。每个团队都在写自己的 linter。
Agent 评估体系 — “没有 JUnit”
Anthropic 用 Playwright 端到端测试评估 agent 生成的代码,发现"生成和评估必须分离"。但没有标准化的评估框架。
代码质量自动治理 — “没有 SonarQube”
OpenAI 用 garbage collection agent 对抗代码库熵增。但"代码库熵管理"甚至还没成为被广泛认知的工程概念。
跨会话状态管理 — “没有 Spring Session”
Anthropic 用 progress file + JSON feature list + git history。OpenAI 用版本化执行计划。各家用各种 ad-hoc 方案传递跨会话状态。
安全护栏 — “没有 Spring Security”
Anthropic 的 Claude Code auto mode(两阶段分类器 + 注入检测)是目前最完整的公开方案,但它是 Claude Code 专有实现,不是通用标准。
标准化的演进路径预测
基于 Java 生态的历史经验,AI agent 标准化可能沿以下路径演进:
第一阶段(当前 2025-2026):协议和格式标准化。 对标 Java 的 JDBC + Servlet 规范。MCP、A2A、AGENTS.md、SKILL.md 已经完成了这一步。这是最基础的层面——定义"接口",让不同实现可以互操作。
第二阶段(预计 2026-2027):框架层标准化。 对标 Spring Framework 的出现。当前 Goose、Claude Agent SDK、Google ADK、LangGraph 等框架在竞争中。最终可能出现少数几个主流框架,内置对四层标准的支持,并提供文档分层、状态管理、安全护栏等上层抽象。
第三阶段(预计 2027+):治理和运维标准化。 对标 Spring Cloud + SonarQube + ArchUnit。架构约束框架、评估标准、代码质量治理、可观测性集成规范逐渐固化为工具和标准。
这个路径不是确定的——AI 领域的演化速度远快于 Java 生态当年。但底层逻辑相同:先标准化接口(让系统能互通),再标准化框架(让开发更高效),最后标准化治理(让运维更可靠)。
生态全景图
最后把所有标准和治理关系放到一张图中:
┌─────────────────────────────────────────────────────────┐
│ Linux Foundation │
│ │
│ ┌──── AAIF ────────────────┐ ┌──────────────────┐ │
│ │ • MCP (Anthropic) │ │ A2A (Google) │ │
│ │ • AGENTS.md (OpenAI) │ │ 独立项目 │ │
│ │ • Goose (Block) │ │ │ │
│ └──────────────────────────┘ └──────────────────┘ │
│ │
└─────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────┐
│ 独立开放标准(非 Linux Foundation) │
│ │
│ • SKILL.md (Anthropic → agentskills.io) │
│ • ACP (IBM BeeAI) — 早期,agent 消息传递 │
│ • UCP (Google) — 早期,agent 商业交易 │
│ │
└─────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────┐
│ 尚无标准,各家探索中 │
│ │
│ • 文档分层架构 (OpenAI/Anthropic 有实践参考) │
│ • 架构约束机械化执行 (OpenAI 有自定义 linter 实践) │
│ • Agent 评估体系 (Anthropic 有 E2E 测试方案) │
│ • 代码质量治理 (OpenAI 有 entropy 管理实践) │
│ • 跨会话状态管理 (Anthropic 有 progress file 方案)│
│ • 安全护栏 (Anthropic 有 auto mode 方案) │
│ │
└─────────────────────────────────────────────────────────┘
对你的实际意义
如果你正在转型 AI 应用工程,这张全景图对你有四个直接指导:
① MCP 是最确定的投资方向。 事实标准,AAIF 中立治理,所有主流工具采用。学 MCP Server 开发不会浪费——就像 2005 年学 JDBC 不会浪费。
② A2A 是下一个该关注的协议。 当你的项目从单 agent 演化到多 agent 协作时(比如 hey!stalker 的多阶段愿景),A2A 就是 agent 间通信的标准方式。现在不需要深入,但需要知道它的存在和设计哲学。
③ SKILL.md 是提升日常效率的即时工具。 你现在就可以安装和使用社区 skill,也可以为自己的常见工作流编写自定义 skill。投入产出比很高。
④ 上层实践(Harness Engineering)是真正的竞争力。 恰恰因为文档分层、架构约束、评估体系、entropy 管理等领域还没有标准化,懂得怎么做这些事的人就是稀缺资源。 而你 7 年的 Java 后端经验(分层架构、依赖管理、CI/CD、代码审查)恰好是这些能力的基础。
一句话总结
AI agent 标准生态正在以惊人的速度分层成型:MCP 管连接、A2A 管通信、AGENTS.md 管配置、SKILL.md 管能力——基础管道的互操作性问题已基本解决。但更高层的工程实践——文档架构、约束执行、评估体系、质量治理——仍是各家探索的前沿。标准的下半场还没开始,你有机会成为定义者而非追随者。
参考来源:
- Linux Foundation, “Announces the Formation of the Agentic AI Foundation (AAIF)”, 2025.12
- Google Developers Blog, “Announcing the Agent2Agent Protocol (A2A)”, 2025.04
- Google Cloud Blog, “Agent2Agent Protocol Is Getting an Upgrade”, 2025.07
- OpenAI, “OpenAI Co-founds the Agentic AI Foundation”, 2025.12
- Anthropic, “Donating the Model Context Protocol and Establishing the AAIF”, 2025.12
- Agent Skills 官方站, agentskills.io
- Google Developers Blog, “Developer’s Guide to AI Agent Protocols”, 2026.03
- Digital Applied, “AI Agent Protocol Ecosystem Map 2026”, 2026.03
- IBM, “What Is Agent2Agent (A2A) Protocol?”, 2025.11
- TechCrunch, “OpenAI, Anthropic, and Block Join New Linux Foundation Effort”, 2025.12
- Serenities AI, “AI Agent Skills Guide 2026”, 2026.03