作者:北辰、羰汤羰
在 AI 领域,各类 Agent(如聊天机器人、自动化工具)正以惊人的速度渗透到应用场景中。但开发者常面临一个棘手问题:不同 AI Agent 框架(如 LangGraph、CrewAI)与前端应用的通信方式五花八门,导致集成成本高、兼容性差。
有没有一种 “通用语言”,能让 AI Agent 与前端应用无缝对话?AG-UI(Agent-User Interaction Protocol)正是为此而生的开源协议(Protocol),用以规范各种 AI Agent 和前端应用间的标准化通讯。 与 MCP 和 A2A 一样,AG-UI 正在重塑人与 AI 交互的底层规则。
AG-UI: Agent-User Interaction Protocol什么是 AG-UI?
AG-UI 是一个轻量级、事件驱动的开源协议,旨在解决 AI agent与前端应用之间的通信难题。它通过标准化的事件流(以 JSON 格式传输),让 AI agent能够与用户界面实时交互。简单来说,AG-UI 就像一个“通用翻译器”,无论 AI agent使用何种“语言”或框架,它都能确保与前端应用的顺畅沟通。
在 Hacker News[1]和 Reddit[2]的讨论中,开发者对 AG-UI 表示了浓厚兴趣。有人称其“解决了agent构建者的许多痛点”,并对与 LangGraph、CrewAI 等框架的集成表示兴奋。在 X 平台上,@svpino 称其为“继 MCP 和 A2A 之后的重大突破”,而 @akshay_pachaar 则强调它“完成了协议栈”。
AG-UI 的核心在于其事件(Event)驱动架构。它定义了 16种标准化事件类型,包括文本消息、工具调用、状态更新等,覆盖了常见的agent-用户交互场景。这些事件通过标准 HTTP(通常使用服务器推送事件,SSE)或其他传输方式(如 WebSocket 或 webhook)进行流式传输,确保低延迟和高可靠性。AG-UI 的关键技术特性如下:
特性描述实时交互支持实时事件流,确保用户与agent状态同步,提供流畅的交互体验。人类参与协作允许用户介入 AI 决策过程,适合需要人工确认或指导的复杂工作流。传输无关性支持 SSE、WebSocket、webhook 等多种传输方式,适应不同应用场景。轻量级设计最小化依赖,易于集成,适合从简单演示到企业级应用的各种规模项目。标准化事件定义 16 种事件类型(如 TEXT_MESSAGE_CONTENT、TOOL_CALL_START),简化开发。核心优势与功能
AG-UI 的设计理念是简单、灵活和开放。以下是其主要优势:
实时交互与状态同步AG-UI 使用事件流(如消息、工具调用、状态差异)保持agent与前端的实时同步。例如,在一个协作场景中,AI agent可以边处理任务边向用户界面发送进度更新,用户也可以随时介入调整。
人类参与协作AG-UI 支持“人类参与”(human-in-the-loop)工作流。例如,一个 Mastra 助手可以在执行复杂任务时暂停,等待用户确认后再继续。这种模式特别适合需要人工监督的场景,如医疗或法律应用。
灵活的传输方式AG-UI 支持 SSE、WebSocket 和 webhook 等多种传输方式。开发者可以根据项目需求选择最适合的通信机制,而无需修改核心逻辑。
与主流框架集成AG-UI 已与多个主流 AI 框架实现“开箱即用”的集成,同时还在快速增加其他常用框架的支持。
开发者友好AG-UI 提供 TypeScript 和 Python SDK,简化集成过程。开发者可以使用 CopilotKit 的组件快速构建 React 前端,或通过 快速入门指南[3]探索交互式 playground。此外,AG-UI 的开放性避免了供应商锁定,允许自由替换模型或工具。同时,AG-UI还提供了其 Cursor 开发指南,喜欢 Vibe Coding的小伙伴可以快速开始使用!
与 MCP 和 A2A 的关系
为了帮助大家理清 AG-UI 与 MCP 和 A2A 的关系,需要先明确这三个协议的定位。AG-UI 的发展是迭代的,先有 MCP 解决模块化组件的结构化通信,再有 A2A 实现专业化 Agent 之间的编排,AG-UI 则是首个明确连接后端 Agent 与前端用户界面的协议。然后我们来回顾一下这 MCP 和 A2A 的定义:
MCP(Model Context Protocol):MCP 是一个开放标准,旨在让 AI 应用连接外部数据源和工具,如 GitHub、Notion 等。它通过客户端-服务器架构,提供预构建的集成,简化 AI 模型与外部系统的交互。MCP 就像 USB-C 一样,为 AI 提供统一接口,减少定制集成的需求。
MCP 与 Function Call、API 的关系。图源:小红书/Github @RangeKingA2A(Agent2Agent Protocol):A2A 也是一个开放标准,允许不同 AI Agent 相互通信和协作。它通过 JSON-RPC 2.0 over HTTP(S) 实现,支持任务委托、信息交换和安全协作,而无需暴露内部状态。
MCP 和 A2A 的协作关系。图源:图源:小红书/Github @RangeKing
所以,AG-UI、MCP 和 A2A 各有侧重点,能够形成互补的生态系统。例如,在客户支持场景中,一个 Agent 可能通过 MCP 访问客户历史记录,通过 A2A 与技术支持 Agent 协作解决问题,最后通过 AG-UI 在聊天界面实时更新用户。
图片由 ChatGPT 生成协议主要功能与 AG-UI 的协作方式MCP连接 AI Agent与外部数据和工具(如数据库、API)Agent 通过 MCP 获取上下文数据,然后通过 AG-UI 显示给用户A2A实现 Agent 间通信和协作(如任务分配)Agent 通过 A2A 协作完成复杂任务,成果通过 AG-UI 反馈用户AG-UI连接 Agent 与前端用户界面,实现实时交互直接处理用户交互,整合 MCP 和 A2A 的输出Next Step?
AG-UI 通过标准化 AI agent与前端应用的连接它为开发者提供了构建实时、交互式应用的强大工具。大家觉得 AG-UI 会成为像 MCP 一样被广泛使用的 AI 协议吗?
对于希望尝试 AG-UI 的开发者,以下是一些入门资源:
官方文档:AG-UI 文档[4]提供详细的协议规范、快速入门指南和交互式示例。GitHub 仓库:AG-UI GitHub[5]包含代码示例、演示应用和贡献指南。演示应用:访问 Hello-World 应用[6],体验俳句生成器的实时交互。社区支持:加入 AG-UI 工作组[7]或在 X 平台关注 @CopilotKit 获取最新动态。参考资料[1]
Hacker News: https://news.ycombinator.com/item?id=43974484
[2]
Reddit: https://www.reddit.com/r/LocalLLaMA/comments/1kl2rol/agui_the_protocol_that_bridges_ai_agents_and_the/
[3]
快速入门指南: https://docs.agentwire.io
[4]
AG-UI 文档: https://docs.ag-ui.com/
[5]
AG-UI GitHub: https://github.com/ag-ui-protocol/ag-ui
[6]
Hello-World 应用: https://agui-demo.vercel.app/
[7]
AG-UI 工作组: https://lu.ma/8supz1j0
-- 完 --