摘要
近期,以“豆包手机助手”为代表的GUI Agent因模拟用户点击操作,绕过平台官方接口,引发了与微信、支付宝、亚马逊等主流应用的广泛冲突与封禁。为解决此矛盾,模型上下文协议(MCP)作为一种AI时代的开放互联协议应运而生,并迅速成为行业事实标准。Anthropic已将MCP捐赠给由Linux基金会托管的Agentic AI基金会,获得了OpenAI、Google、阿里等科技巨头的普遍支持。MCP旨在为智能体AI建立一套标准化的“正式入口”,通过协议层明确权限与边界,实现AI与平台间的安全、有序交互,标志着AI交互方式从“模仿人类”向“协议驱动”的根本性转变。
线索
投资机会:
1. MCP生态基础设施: 围绕MCP协议构建服务器、开发工具和集成解决方案的公司将迎来增长机遇。例如,提供MCP服务器(如阿里云百炼、高德地图)或集成MCP的开发环境(如VS Code、Cursor)的企业,将成为AI生态底层连接的关键节点。
2. AI原生平台与服务: 率先完成MCP改造,为AI智能体提供原生、深度接口的平台,将能构建更强大的AI体验和护城河,吸引更多AI应用和用户,从而在竞争中占据优势。
3. 系统级智能体与OS厂商: 能够在操作系统层面统一管理智能体权限、协调跨平台任务的公司,将成为未来AI交互的核心枢纽。这为操作系统和终端设备厂商提供了新的价值增长点。
潜在风险:
1. GUI Agent技术路线的淘汰风险: 高度依赖GUI模拟技术的AI应用和设备(如“豆包手机”助手)面临被主流平台联合封禁的持续性风险,其商业模式和技术路径的可持续性存疑,可能仅作为过渡方案存在。
2. 平台改造滞后风险: 未能及时跟进和集成MCP等新协议的传统互联网平台,可能会在AI时代被边缘化。其用户体验和数据价值将无法通过智能体得到有效释放,面临用户流失的风险。
3. 标准竞争与实施不确定性: 尽管MCP已成为事实标准,但协议的全面落地仍需“漫长的改造”。期间可能出现其他竞争性协议,或因实施复杂度、安全合规问题(如中国信通院提出的双重授权要求)导致推广速度不及预期。
正文
近期,包括微信、支付宝、拼多多、淘宝及多家银行应用在内的平台,开始限制或禁止用户在nubia M53(俗称“豆包手机”)上登录和使用其服务。此类冲突的核心在于一种名为GUI Agent的技术路线。该技术让AI通过识别图形用户界面(GUI)来模拟人类点击、跳转等操作,例如执行“帮我比价下单”的指令时全程不依赖官方接口。
类似的技术冲突也发生在Web端,AI搜索初创公司Perplexity旗下的Comet AI因直接解析商品页面为用户提供购买建议,绕过了平台的推荐与广告体系,而收到了亚马逊的严正警告。GUI Agent模式对现有互联网生态的系统权限、平台秩序和安全边界构成了挑战。
为应对这些挑战,一种名为模型上下文协议(MCP)的Agent模式提供了新的解决思路。2025年12月10日,Anthropic公司宣布将MCP正式捐赠给新成立的Agentic AI基金会,并由Linux基金会进行统一托管。MCP旨在为智能体时代建立一套属于AI的开放互联协议。
MCP协议并非全新概念。阿里云智能集团资深副总裁刘伟光在此前曾表示,MCP通过统一的标准化接口,降低了大模型与外部系统的集成门槛,其作用类似于USB-C接口。在Anthropic正式捐赠前,MCP已成为行业内的事实标准。
MCP最初是Anthropic工程师为Claude设计的统一工具接入规范,旨在解决大模型调用外部工具和读取本地数据时需反复编写适配代码的问题。开发者遵循这套JSON-RPC协议,即可将文件系统、数据库、业务工具等以统一方式接入Cla。因其简单、直接、可复用的特点,MCP从2024年中开始在行业内迅速普及。
截至2025年,VS Code、Cursor、Windsurf等新一代开发环境已集成MCP;OpenAI在官方文档中将其列为首选扩展路径;Google的部分内部Agent工具链也开始基于MCP构建;阿里巴巴、字节跳动、腾讯的工程团队也在项目中采用MCP作为AI系统的互联方式。“支持MCP”已成为Agent类产品的标配。
过去二十年,互联网依赖HTTP、TCP/IP等协议运行。同样,智能体AI要在不同系统间自由交换信息和调用工具,也需要自己的协议层,MCP目前被视为最佳答案。MCP被捐赠给Linux基金会,意味着它不再属于某一家公司,而是进入了更中立的治理体系,向行业发出了一个信号:AI世界需要一套不依赖任何巨头、可被所有模型与平台共同遵循的底层协议。
除MCP外,Agentic AI基金会的初始项目还包括OpenAI捐赠的AGNTS.md(为Agent编写使用说明的标准)和Google捐赠的Block(构建智能体和工作流的框架)。Google也推出了自家的远程MCP服务器,便于智能体接入Google地图、BigQuery等云端服务。阿里云百炼平台此前也已推出了全生命周期的MCP服务。
GUI Agent路线之所以引发冲突,是因为在互联网生态未为AI做好准备时,它是唯一能大规模跑起来的通用方案,不依赖平台配合。但正因其“无所不通”,它也跳过了产品逻辑、商业链路和风控体系,导致平台无法控制AI的交互行为,责任边界模糊。
针对这一问题,中国信通院牵头发布了《端云协同智能体交互双重授权安全指引》,明确提出智能体AI“需同时获得应用授权与用户授权,才能合法访问第三方应用”。GUI路线与平台生态的天然矛盾,使得其长期共存面临困难。Anthropic自身在推出MCP后,也基本停止了对早期基于GUI的“Computer Use”功能的对外更新。
与GUI模拟用户不同,MCP为智能体AI建立了“正式入口”,使平台能将交互边界显性化,例如明确哪些能力可读、哪些操作需二次确认。MCP将智能体与系统的关系从“依赖UI”提升为“依赖能力”。例如,查询订单在GUI模式下需多步操作,在MCP模式下可能只是一次明确的能力请求。
未来的AI生态很可能不会是GUI与MCP的简单取舍。GUI将继续作为“兜底”方案,让智能体在尚未完成改造的旧系统中运行;而MCP则成为跨系统、跨平台的底层互联方式,为智能体建立清晰的权限、边界与秩序。
在此之上,终端设备上的系统级智能体将负责理解用户目标,协调设备、平台与服务,在平台规则内完成跨生态任务。操作系统提供统一的智能体入口和权限管理,MCP等协议负责与各家服务沟通,而具体的AI模型(如Qwen、Gemini、GPT)则可插拔替换。这被认为是智能体AI发展的终局形态。
发布时间
2025-12-14 15:37:00



评论 ( 0 )