• 发文
  • 评论
  • 微博
  • 空间
  • 微信

继MCP和A2A,又来一个AG-UI!来聊聊究竟是何方神圣,是三足鼎立还是同心协力?

机智流 2025-05-19 10:40 发文

作者:北辰、羰汤羰

在 AI 领域,各类 Agent(如聊天机器人、自动化工具)正以惊人的速度渗透到应用场景中。但开发者常面临一个棘手问题:不同 AI Agent 框架(如 LangGraph、CrewAI)与前端应用的通信方式五花八门,导致集成成本高、兼容性差。

有没有一种 “通用语言”,能让 AI Agent 与前端应用无缝对话?AG-UI(Agent-User Interaction Protocol)正是为此而生的开源协议(Protocol),用以规范各种 AI Agent 和前端应用间的标准化通讯。 与 MCP 和 A2A 一样,AG-UI 正在重塑人与 AI 交互的底层规则。

AG-UI: Agent-User Interaction Protocol什么是 AG-UI?

AG-UI 是一个轻量级、事件驱动的开源协议,旨在解决 AI agent与前端应用之间的通信难题。它通过标准化的事件流(以 JSON 格式传输),让 AI agent能够与用户界面实时交互。简单来说,AG-UI 就像一个“通用翻译器”,无论 AI agent使用何种“语言”或框架,它都能确保与前端应用的顺畅沟通。

在 Hacker News[1]和 Reddit[2]的讨论中,开发者对 AG-UI 表示了浓厚兴趣。有人称其“解决了agent构建者的许多痛点”,并对与 LangGraph、CrewAI 等框架的集成表示兴奋。在 X 平台上,@svpino 称其为“继 MCP 和 A2A 之后的重大突破”,而 @akshay_pachaar 则强调它“完成了协议栈”。

AG-UI 的核心在于其事件(Event)驱动架构。它定义了 16种标准化事件类型,包括文本消息、工具调用、状态更新等,覆盖了常见的agent-用户交互场景。这些事件通过标准 HTTP(通常使用服务器推送事件,SSE)或其他传输方式(如 WebSocket 或 webhook)进行流式传输,确保低延迟和高可靠性。AG-UI 的关键技术特性如下:

特性描述实时交互支持实时事件流,确保用户与agent状态同步,提供流畅的交互体验。人类参与协作允许用户介入 AI 决策过程,适合需要人工确认或指导的复杂工作流。传输无关性支持 SSE、WebSocket、webhook 等多种传输方式,适应不同应用场景。轻量级设计最小化依赖,易于集成,适合从简单演示到企业级应用的各种规模项目。标准化事件定义 16 种事件类型(如 TEXT_MESSAGE_CONTENT、TOOL_CALL_START),简化开发。核心优势与功能

AG-UI 的设计理念是简单、灵活和开放。以下是其主要优势:

实时交互与状态同步AG-UI 使用事件流(如消息、工具调用、状态差异)保持agent与前端的实时同步。例如,在一个协作场景中,AI agent可以边处理任务边向用户界面发送进度更新,用户也可以随时介入调整。

人类参与协作AG-UI 支持“人类参与”(human-in-the-loop)工作流。例如,一个 Mastra 助手可以在执行复杂任务时暂停,等待用户确认后再继续。这种模式特别适合需要人工监督的场景,如医疗或法律应用。

灵活的传输方式AG-UI 支持 SSE、WebSocket 和 webhook 等多种传输方式。开发者可以根据项目需求选择最适合的通信机制,而无需修改核心逻辑。

与主流框架集成AG-UI 已与多个主流 AI 框架实现“开箱即用”的集成,同时还在快速增加其他常用框架的支持。

开发者友好AG-UI 提供 TypeScript 和 Python SDK,简化集成过程。开发者可以使用 CopilotKit 的组件快速构建 React 前端,或通过 快速入门指南[3]探索交互式 playground。此外,AG-UI 的开放性避免了供应商锁定,允许自由替换模型或工具。同时,AG-UI还提供了其 Cursor 开发指南,喜欢 Vibe Coding的小伙伴可以快速开始使用!

与 MCP 和 A2A 的关系

为了帮助大家理清 AG-UI 与 MCP 和 A2A 的关系,需要先明确这三个协议的定位。AG-UI 的发展是迭代的,先有 MCP 解决模块化组件的结构化通信,再有 A2A 实现专业化 Agent 之间的编排,AG-UI 则是首个明确连接后端 Agent 与前端用户界面的协议。然后我们来回顾一下这 MCP 和 A2A 的定义:

MCP(Model Context Protocol):MCP 是一个开放标准,旨在让 AI 应用连接外部数据源和工具,如 GitHub、Notion 等。它通过客户端-服务器架构,提供预构建的集成,简化 AI 模型与外部系统的交互。MCP 就像 USB-C 一样,为 AI 提供统一接口,减少定制集成的需求。

MCP 与 Function Call、API 的关系。图源:小红书/Github @RangeKingA2A(Agent2Agent Protocol):A2A 也是一个开放标准,允许不同 AI Agent 相互通信和协作。它通过 JSON-RPC 2.0 over HTTP(S) 实现,支持任务委托、信息交换和安全协作,而无需暴露内部状态。

MCP 和 A2A 的协作关系。图源:图源:小红书/Github @RangeKing

所以,AG-UI、MCP 和 A2A 各有侧重点,能够形成互补的生态系统。例如,在客户支持场景中,一个 Agent 可能通过 MCP 访问客户历史记录,通过 A2A 与技术支持 Agent 协作解决问题,最后通过 AG-UI 在聊天界面实时更新用户。

图片由 ChatGPT 生成协议主要功能与 AG-UI 的协作方式MCP连接 AI Agent与外部数据和工具(如数据库、API)Agent 通过 MCP 获取上下文数据,然后通过 AG-UI 显示给用户A2A实现 Agent 间通信和协作(如任务分配)Agent 通过 A2A 协作完成复杂任务,成果通过 AG-UI 反馈用户AG-UI连接 Agent 与前端用户界面,实现实时交互直接处理用户交互,整合 MCP 和 A2A 的输出Next Step?

AG-UI 通过标准化 AI agent与前端应用的连接它为开发者提供了构建实时、交互式应用的强大工具。大家觉得 AG-UI 会成为像 MCP 一样被广泛使用的 AI 协议吗?

对于希望尝试 AG-UI 的开发者,以下是一些入门资源:

官方文档:AG-UI 文档[4]提供详细的协议规范、快速入门指南和交互式示例。GitHub 仓库:AG-UI GitHub[5]包含代码示例、演示应用和贡献指南。演示应用:访问 Hello-World 应用[6],体验俳句生成器的实时交互。社区支持:加入 AG-UI 工作组[7]或在 X 平台关注 @CopilotKit 获取最新动态。参考资料[1] 

Hacker News: https://news.ycombinator.com/item?id=43974484

[2] 

Reddit: https://www.reddit.com/r/LocalLLaMA/comments/1kl2rol/agui_the_protocol_that_bridges_ai_agents_and_the/

[3] 

快速入门指南: https://docs.agentwire.io

[4] 

AG-UI 文档: https://docs.ag-ui.com/

[5] 

AG-UI GitHub: https://github.com/ag-ui-protocol/ag-ui

[6] 

Hello-World 应用: https://agui-demo.vercel.app/

[7] 

AG-UI 工作组: https://lu.ma/8supz1j0

-- 完 --

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    机智流

    关注AI领域前沿产业资讯和学术研...

    推荐商品

      举报文章问题

      ×
      • 营销广告
      • 重复、旧闻
      • 格式问题
      • 低俗
      • 标题夸张
      • 与事实不符
      • 疑似抄袭
      • 我有话要说
      确定 取消

      举报评论问题

      ×
      • 淫秽色情
      • 营销广告
      • 恶意攻击谩骂
      • 我要吐槽
      确定 取消

      用户登录×

      请输入用户名/手机/邮箱

      请输入密码