谷歌于2025年4月在Google Cloud Next 25大会上正式开源发布了首个标准智能体交互协议——Agent2Agent Protocol(A2A)。这一消息迅速引发广泛关注,被认为是AI领域的重要里程碑。
A2A协议获得了包括Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等50多家主流企业应用平台的积极响应。
谷歌推出A2A协议旨在打破AI智能体系统孤岛,通过建立标准化的智能体交互框架,促进不同平台和生态中的AI智能体进行安全、标准化协作,推动AI生态系统的发展。
当前AI智能体如同"信息孤岛",无法有效协作。不同公司和平台开发的智能体之间存在沟通障碍,形成了系统孤岛,严重制约了AI在解决复杂问题上的能力。
A2A协议通过提供标准化的通信方式,让不同框架和供应商构建的智能体能够相互沟通、协作。它为智能体提供了一种类似人类对话的高层次通信方式,支持跨平台多模态协同。
AI智能体互操作的核心挑战在于异构实现下的通信协作。不同供应商或框架开发的智能体往往难以在同一环境中安全、可控、灵活地彼此协作,导致效率低下和资源浪费。
A2A协议构成一个开源的标准化框架,旨在建立AI智能体间的通用通信标准,促进不同供应商和框架的Agent安全协作。
A2A协议基于HTTP等成熟技术,设计为开放、中立的标准,旨在提升智能体协作的安全性和效率。
谷歌与超过50家技术合作伙伴共同支持A2A协议,致力于打破智能体间的交互壁垒,为开放协作生态奠定基础。
A2A协议让智能体以自然、非结构化的方式协作,即使不共享内存、工具和上下文,实现真正的多智能体场景。
A2A建立在HTTP、SSE、JSON-RPC等现有标准之上,简化了与企业现有IT基础设施的集成,降低开发成本。
A2A设计支持企业级认证和授权,发布时即与OpenAPI的身份验证方案保持同等水平,确保数据传输安全性。
A2A协议设计灵活,既能处理快速任务,也支持数小时甚至数天的深度研究,并提供实时反馈和状态更新。
A2A支持文本、音频、视频流等多种模态,适应多样化智能体交互需求,提升协作效率。
A2A协议采用开放、中立的设计理念,是一个开源协议,基于Apache 2.0许可。协议为AI智能体提供标准的交互方式,使不同平台和生态中的AI智能体能够相互协作,无论它们的底层框架或供应商。
协议建立在HTTP、SSE、JSON-RPC等现有流行标准之上,通过与企业现有IT栈的无缝集成,使得A2A协议能够在不大幅改变现有系统架构的情况下实现兼容。
A2A协议不仅支持文本交互,还包括对音频、视频流等多种传播模式的兼容。这种设计让智能体能够在更多场景下进行协作,包括实时语音对话和视频分析等应用。
A2A协议提供了开放的Agent能力发现机制,每个代理都可以通过AgentCard声明自己的能力。通过在已知路径发布AgentCard,或通过注册表形式,实现能力的开放式发现和共享。
A2A协议采用企业级安全架构,支持细粒度访问控制。协议通过采用OAuth 2.1与OpenID Connect的混合模式进行身份认证,确保只有经过授权的用户和系统可以访问代理,有效防止数据泄露风险。
A2A协议基于HTTP进行通信,要求在生产环境中使用HTTPS配合现代TLS加密套件保护数据传输安全。服务端通过TLS证书向客户端证明身份,客户端必须验证服务端证书,确保全程加密和通信安全。
协议设计灵活,既能处理快速任务,也支持需要数小时甚至数天的深度研究。在整个任务执行过程中,A2A能够持续向用户提供实时反馈、通知和状态更新,确保任务执行的可控性。
A2A服务端在Agent Card中声明支持的认证协议,包括API Keys、OAuth等。通过客户端身份和用户身份的双重验证,实现细粒度的权限控制,并对敏感操作进行单独授权,确保数据安全。
AgentCard是智能体用来展示自身能力的JSON格式文件,类似于AI领域的电子简历或数字名片。它包含智能体的名字、联系方式(URL)、提供的服务或技能,以及能处理的信息格式和工作风格等基本信息。
{
"name": "招聘助手",
"version": "1.0.0",
"description": "专门处理招聘流程的AI智能体",
"contact": {
"url": "https://example.com/recruiting-agent"
},
"capabilities": [
"简历筛选",
"面试安排",
"候选人评估"
],
"authentication": {
"type": "oauth2"
}
}
Agent通过AgentCard公开声明其功能边界,包括支持的任务类型、输入输出格式及服务质量指标。客户端Agent可以在发现阶段通过解析AgentCard来识别最适合执行特定任务的远程Agent。
AgentCard建议托管在标准路径这种标准化路径使得智能体能够容易地被发现,类似于网站的robots.txt或网站地图文件下(https://baseurl/.well-known/agent.json),客户端Agent可通过HTTP GET方式获取AgentCard,实现对远程Agent能力的发现和识别。
A2A协议通过定义任务对象来实现客户端Agent与远程Agent之间的协作。任务是具有明确生命周期的结构化实体,支持即时完成或长时运行,任务完成后生成的输出称为工件。
任务已被创建并提交给服务器
服务器正在处理任务
任务需要额外信息才能继续
任务已成功完成
协议支持从快速任务到需要数小时甚至数天的深度研究任务,通过Server-Sent Events实现状态流式更新,并结合检查点机制确保任务可恢复性。
客户端Agent负责制定和传达任务,远程Agent负责执行任务。在任务执行过程中,Agent可以相互通信,实时同步任务状态,确保任务协同的高效性。
消息是A2A协议中智能体之间传递信息的基本实体,可用于传递上下文信息、用户指令、回复内容或任务结果。消息是Agent协作的核心机制,通过消息传递实现双向互动和信息同步。
用于传递纯文本信息,支持Markdown格式化
用于传输文件,如图片、文档或其他二进制数据
用于结构化数据,如JSON对象,便于机器解析
每条消息中的Part都包含特定的内容类型,智能体之间可以就内容的展示格式进行协商。这包括对视频分辨率、UI适配等的协商,确保在不同设备上提供一致的用户体验。
A2A协议支持文本、图像、音频和视频等多种模态的内容交换。通过MIME类型协商机制,可以灵活支持不同类型内容的传输,满足不同场景下的多媒体交互需求。
A2A协议采用OAuth 2.1与OpenID Connect的混合认证模式,支持细粒度的访问控制。客户端通过与独立的认证机构协商获取权限凭证,这些凭证通过HTTP Header传递给A2A服务端,确保只有授权的客户端才能访问。
A2A支持安全的推送通知机制,允许代理在不持续连接的情况下向客户端发送更新。推送通知时,代理需要验证通知服务的身份,使用受信任的凭证进行身份验证,并设置Webhook接收任务状态更新。
A2A协议设计上只共享完成任务所必需的输入和输出数据,不会暴露Agent内部的思考过程或记忆状态,有效保护了AI系统的敏感信息和核心数据。
A2A协议工作流程图 (来源: Koyeb)
| 比较方面 | MCP协议 | A2A协议 |
|---|---|---|
| 主要功能 | 专注于模型上下文的工具调用标准 | 智能体之间的通信与协作标准 |
| 定位类比 | 类似计算机的USB接口 | 类似人际之间的电话通信 |
| 解决问题 | AI模型与外部工具、数据源交互 | 不同智能体之间的协作交流 |
| 主要目标 | 标准化工具调用 | 跨平台多智能体协同 |
MCP协议是专注于模型上下文的工具调用标准协议,为AI模型提供标准化的"工具调用语言",类似于计算机的USB接口。它主要解决AI模型与外部工具、数据源(如数据库、API、文件系统)的交互问题。
A2A协议是针对智能体之间的协作通信协议,可让AI智能体之间直接通信、安全地交换信息,并在各种企业平台或应用程序上协调操作。它专注于实现跨平台、跨系统的多智能体协同。
相比MCP协议服务于工具调用,A2A协议定位在同一层级的智能体之间的通信,类似于电话簿,而MCP协议则类似于工具说明书。A2A协议还为智能体提供了更灵活的能力,支持动态多轮对话。
A2A协议采用客户端-远程智能体的协作模式,通过HTTP(S)协议实现JSON-RPC 2.0通信框架,建立智能体间的异步消息通道。这种设计使单个智能体既能通过MCP获取领域专业知识,又能通过A2A与其他智能体形成动态协作网络。
A2A与MCP在不同能力方面的对比
在安全性方面,A2A支持企业级身份验证机制,其安全性与OpenAPI标准相当。通过JSON-RPC接口实现标准化的身份验证和数据交换,确保了通信双方的安全性和一致性。
A2A协议通过结构化的Tasks和Artifacts来交换信息,基于HTTP、JSON-RPC和SSE等成熟的Web标准实现信息传递。这种设计确保了协作的高效性和一致性,同时支持企业级的身份验证和数据交换。
A2A协议与MCP协议并非竞争关系,而是互补的。A2A专注于智能体间的通信与协作,而MCP则为智能体提供工具和背景信息,两者结合能更好地推动智能体生态的发展。
A2A与MCP协议的互补关系示意图
在实际应用中,MCP让单个智能体能够调用工具和资源,而A2A则使多个智能体之间能够高效协作。两者的结合使复杂任务的完成变得更加高效。
在汽车维修场景中,MCP确保智能体能够精确使用专用工具,而A2A则支持智能体间的沟通协调,帮助维修工与顾客和供应商有效协作,展示两者互补的应用场景。
场景流程:
传统招聘过程中,招聘经理需要在多个系统之间切换操作,包括招聘网站、内部HR系统、社交媒体平台等,手动复制粘贴信息,效率低下且容易出错。
招聘经理向主Agent提出需求,Agent协调多个招聘平台Agent搜索候选人
多Agent协作分析简历,自动匹配职位要求,生成综合评估报告
主Agent与日历Agent协调安排面试时间,自动发送邀请和提醒
专业背景调查Agent自动核实候选人信息,并生成合规报告
入职Agent协调准备合同、设置账户及培训计划,实现平滑入职
A2A协议打破了不同供应商Agent之间的孤岛效应,使招聘流程由多个专门Agent协作完成。这种协作方式显著提高了招聘效率,减少了人工干预,实现了招聘流程的数字化协同。
通过A2A协议管理的招聘流程中,各环节任务状态实时同步,包括职位发布、简历筛选、面试安排和背景调查等。招聘经理可以在统一界面上跟踪整个流程的进度。
A2A协议专为企业级应用设计,支持智能体在不同平台和系统间无缝协作。它通过标准化的接口和灵活的架构,降低了企业集成和管理多智能体系统的复杂性。
供应链中的多个智能体通过A2A协议实现库存管理、物流协调和需求预测的自动化,提高供应链韧性和响应速度。
关键优势: 实时库存可视化、自动补货、供应商评估、物流优化
客服智能体与产品、技术、物流等多个智能体协作,提供全方位的客户支持,实现问题快速解决和客户满意度提升。
关键优势: 全渠道支持、跨部门协调、知识共享、自动升级
A2A协议在企业中实现了跨系统的智能体协作,如订单管理系统与物流智能体的实时数据交换。企业可以通过A2A协议,优化供应链管理、提升客户服务效率,并降低运营成本。
A2A协议通过企业级安全设计,支持细粒度访问控制和长时任务协作。它增强了企业智能体的自主性和协作效率,实现跨部门业务流程的自动化。
A2A协议支持多种模态,包括文本、图像、音频和视频流,打破智能体的交互壁垒,为人机协作与交互提供广泛支持。
文本内容
图像数据
音频流
视频内容
A2A协议允许智能体通过MIME类型协商,进行异构数据交换,支持文本、图表、视频流等多种数据格式,提升跨领域协作效率。
在医疗和科研领域,多模态交互成为智能体协作的基石,支持3D模型和视频流等多媒体传输,提高协作效率。
A2A协议通过用户协商机制,确保智能体在不同设备上呈现最佳内容,提供个性化的用户交互体验。
A2A协议通过标准化的交互方式,使不同供应商的专业化Agent能够跨系统、跨应用地协同工作,构建复杂的自动化工作流,显著提升企业流程效率。
A2A协议为企业流程带来的价值分布
A2A协议支持构建多智能体工作流,通过统一界面协调不同专业的智能体,实现从数据获取到决策执行的全链路自动化,提升企业级效率。
A2A协议通过任务管理机制,支持复杂任务的自动化,简化企业内部的跨系统协作,显著提升从招聘到供应链管理等各项流程的效率。
A2A协议的合作伙伴生态 (来源: Google)
A2A协议获得了超过50家技术合作伙伴的支持与贡献,包括Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG、Workday等主流企业应用平台。
除技术公司外,A2A还得到了埃森哲、BCG、凯捷、德勤、甲骨文、HCL科技、印孚瑟斯、KPMG、麦肯锡、普华永道等知名服务提供商的支持,形成了强大的生态联盟。
参与A2A的企业覆盖多个关键领域,包括企业应用(Salesforce、SAP)、协作与内容管理(Atlassian、Box)、金融科技(PayPal)、咨询服务(埃森哲、BCG)等,形成了全面的生态覆盖。
"我们很高兴参与共同制定共享协议,这将使所有人的智能体能够无缝协作,共同完成比单独行动更复杂的任务。"
— Harrison Chase, LangChain CEO
谷歌已将A2A协议开源发布,作为一项由社区驱动的开放项目。项目托管在GitHub上,社区可以为A2A项目做出贡献并提出代码更新建议。虽然设有治理委员会,但谷歌希望A2A能够真正实现开放发展。
代码开源托管,支持社区贡献
详细的开发指南与API参考
多种语言实现的示例与教程
谷歌为开发者提供了完整的A2A开发资源,包括技术文档、代码示例和详细的部署指南。开发者可以随时查阅协议规范,了解具体使用方法,还能够通过Google表单反馈建议。
作为开源协议,A2A鼓励开发者共同参与完善。虽然目前还处于草案阶段,但通过社区持续迭代和发展,A2A将成为一个成熟的行业标准。目前该项目已在GitHub获得超过50家技术合作伙伴的支持。
标准化是推动AI智能体技术成熟和广泛应用的关键因素。A2A协议的推出标志着向行业标准化迈出了重要一步,它有望促进AI智能体生态系统的繁荣发展,并为企业级应用带来重大价值。
统一了互联网通信,催生全球网络繁荣
解决了设备连接混乱,简化了用户体验
将统一AI智能体交互,推动AI生态发展
A2A协议有望成为智能体协作的底层标准,类似于HTTP对Web的基础性作用。通过开放协议规范,A2A为开发人员提供了丰富的技术实现空间,促进了技术的多样性,为行业标准的建立奠定了坚实基础。
尽管A2A协议目前仍处于草案阶段,但已获得众多行业领导者的认可。随着社区的持续迭代和不断完善,A2A有望发展成为被广泛采用的成熟行业标准,推动智能体协作生态系统的持续进步。
A2A协议即将在2025年第三季度发布1.0正式版,并寻求W3C等标准化组织的认可。后续版本将重点关注金融、医疗等垂直行业领域的支持,以满足不同场景的应用需求。
核心功能实现,基础API定义
稳定API,性能优化,全面文档
金融、医疗等领域专用扩展
W3C标准化,全面生态整合
未来A2A协议将增强智能体发现、动态技能检查等功能,并改进任务生命周期管理。通过智能路由选择最优服务商,支持人机协作和自动生成交接报告,提升AI系统整体效率。
谷歌推出的Firebase Studio作为新一代云端智能开发环境,提供完整的全栈开发工具链。内置Gemini Code Assist驱动的原型开发工具,支持快速构建AI应用,并具备端到端测试和云端集成能力。
A2A协议获得了超过50家技术合作伙伴的支持,这些企业包括Atlassian、Box、Cohere等技术平台,以及Accenture、BCG等服务机构,显示了行业对该协议的广泛认可和积极参与。
基于A2A的智能体交易平台
医疗、金融专用智能体
自组织智能体协作系统
A2A智能体开发平台
通过A2A协议,不同企业间的AI智能体可以实现无缝协作,这将极大地推动智能体生态的快速发展,并催生出繁荣的智能体经济。
A2A协议通过其开放性,促进了智能体的互操作性,使企业和开发者能够共同推动协议发展,未来有望成为智能体协作的底层标准。
A2A协议对开源社区的依赖可能导致系统碎片化,不同实现版本间可能出现不兼容问题。
当多个智能体协作时,如何确保整体行为符合伦理标准和用户预期,是A2A面临的重要挑战。
智能体之间的信息交换可能导致数据泄露和隐私侵犯风险,需要更强大的安全机制。
"A2A协议是AI技术发展历程中的关键里程碑,它将开启一个智能体能够像人类团队一样协作的新时代。"
A2A协议为AI智能体之间的协作提供了开放、标准化的技术框架,这一突破性进展标志着AI技术在跨平台协作和生态系统整合方面迈出了重要一步,将显著提升生产力并降低长期成本。
A2A协议的推出打破了目前AI智能体生态系统中存在的碎片化现象,通过降低智能体互操作的门槛,促使AI系统能够相互理解、协作,共同完成复杂任务,为AI协作带来新的可能性。
作为AI协作的技术新方向,A2A不仅提升了生产力,还通过实现智能体间的无缝协作推动了整个AI领域的发展,为未来智能化竞争奠定了基础,展现了巨大的技术创新潜力。
A2A协议通过建立标准化的智能体交互框架,有效解决现有Agent框架碎片化导致的生态割裂问题。这一统一的技术规范使不同框架实现的Agent能够更好地协同,显著降低落地复杂度,为开放智能体生态奠定基础。
A2A协议得到了超过50家技术合作伙伴和领先服务提供商的支持,包括Atlassian、Box、Cohere等技术平台,以及Accenture、BCG等服务机构。强大的生态支持预示着A2A有望成为未来智能体交互的事实标准。
A2A协议支持去中心化的智能体协作网络构建,每个网站可通过P2P网络广播AgentCard,实现自组织化协作。这种开放架构使得智能体能够像人类团队般分工协作,共同完成复杂任务。
作为开放标准,A2A协议为开发者提供了广阔的创新空间和明确的技术规范。这种开放性不仅吸引了更多参与者加入生态系统,也促进了多样化解决方案的涌现,加速了AI技术在各领域的应用创新。
A2A协议为AI技术带来的主要价值
A2A协议为企业构建专业化的智能体团队提供可能,每个智能体可专注于特定领域,显著提升整体效率。这种模式大大降低了AI应用的开发和部署门槛,使中小企业也能获得AI带来的生产力提升。
随着A2A协议的普及应用,各类AI能力将以智能体的形式实现封装、分享和交易,这将推动AI技术真正融入我们的日常生活和工作中,让人们的生活和工作变得更加轻松便捷。