ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

谷歌推Gemini Deep Research Agent降本增效

2025-12-14

摘要

谷歌发布了三项与AI代理相关的重要更新:升级了其Deep Research Agent,该代理基于Gemini 3 Pro模型,在内部基准测试中得分46.4%,达到SOTA水平,且成本约为GPT-5 Pro的十分之一;开源了名为DeepSearchQA的新基准,包含900个涵盖17个领域的任务,用于评估代理的复杂研究能力;并推出了Interactions API,作为与Gemini模型和代理交互的统一接口,旨在简化开发流程。

线索

谷歌此次发布的核心投资线索在于其通过成本优势和生态建设抢占AI代理市场的战略意图。Deep Research Agent宣称成本仅为竞品的十分之一,若性能得到市场验证,将极大吸引对成本敏感的开发者和企业,快速扩大用户基数。同时,通过开源DeepSearchQA基准和推出统一的Interactions API,谷歌正在构建一个以自身技术为核心的Agent开发生态,这不仅能锁定开发者,还能通过社区反馈加速技术迭代,形成强大的网络效应和护城河。其在金融、生物技术等高价值领域的应用规划,以及未来向Vertex AI平台的整合,表明其目标直指利润丰厚的企业级市场,具备长期商业变现潜力。

正文

谷歌发布了三项与Agent相关的更新,包括Deep Research Agent功能更新、新网络研究Agent基准DeepSearchQA的开源,以及新交互API的推出。

一、Deep Research Agent更新

Gemini Deep Research是一款专为长期上下文采集和综合任务优化的Agent,其背后的模型是Gemini 3 Pro。该模型通过多步强化学习的扩展搜索,能够自主地以高精度导航复杂的信息环境。此次更新包括针对特定数据进行网页搜索、以更低成本生成研究报告等功能。

根据谷歌DeepMind产品经理路卡斯·哈斯透露,新Gemini Deep Research Agent在谷歌新基准测试上得分46.4%,实现了SOTA(State-of-the-art)。在BrowseComp基准上,其表现与GPT-5 Pro相当,但价格约为GPT-5 Pro的十分之一。

该Agent将在谷歌搜索、笔记本、谷歌金融中提供,并在Gemini应用中升级。其应用领域包括金融服务、生物技术和市场调研等需要高精度和初步调研的复杂行业。

对于开发者,Gemini Deep Research Agent具备以下功能:

统一信息综合:通过文件上传和文件搜索工具分析用户文档和公共网络数据,能处理长上下文,允许用户在提示中放置大量背景信息。

报告可控性:用户可通过提示定义结构、头部,或指定数据表生成和格式来控制输出。

详细引用:提供细粒度的来源,允许用户验证数据来源。

结构化输出:支持JSON模式输出,便于下游应用解析研究结果。

二、DeepSearchQA基准开源

DeepSearchQA是一个用于评估Agent在复杂、需要多步查询信息任务上能力的开源基准。现有基准测试往往无法反映现实世界多步网络研究的复杂性,DeepSearchQA旨在弥补这一不足。

该基准内置了900个手工设计的“因果链”任务,涵盖17个领域。与传统的基于事实的测试不同,DeepSearchQA衡量的是全面性,要求Agent生成详尽的答案集,评估其研究的准确性和检索记忆能力。

谷歌在内部评估中发现,当允许Agent执行更多搜索与推理步骤时,其性能会获得显著提升。因此,DeepSearchQA也可作为衡量“思考时长”效率的工具。

三、交互API推出

交互API是谷歌推出的与Gemini模型和Agent交互的统一界面,通过Google AI Studio中的Gemini API公开测试版向开发者开放。开发者可以通过Agent开发套件(ADK)和A2A协议使用该API。

交互API原生集成了专为Agent应用开发场景设计的专属接口,可高效处理交错式消息、思维链、工具调用及其状态信息的复杂上下文管理工作。它不仅支持Gemini模型套件,还提供了首个内置Agent——Gemini Deep Research Agent。

未来,谷歌计划扩展其内置Agent,并提供构建和引入其他Agent的功能,使开发者能够通过一个API连接Gemini模型、谷歌内置Agent和开发者的定制Agent。

交互API的核心功能扩展包括:

可选的服务器端状态:将历史管理卸载到服务器,简化客户端代码,减少上下文管理错误,并可能通过增加缓存命中率来降低成本。

可解释和可组合的数据模型:为复杂的Agent历史设计的干净图式,方便开发者对交错的信息、思维、工具及其结果进行调试、流式分析和推理。

背景执行:将长期运行的推理环路卸载到服务器,无需维护客户端连接。

远程MCP工具支持:模型可以直接调用模型上下文协议(MCP)服务器作为工具。

四、未来规划

谷歌未来的更新将聚焦于更丰富的输出功能,如原生生成图表以支持可视化分析报告。同时,将通过模型上下文协议(MCP)支持扩展连接性,以便更轻松地访问自定义数据源。谷歌还计划将Gemini Deep Research引入企业用的Vertex AI平台。

发布时间

2025-12-12 08:46:29

相关推荐

评论 ( 0 )

3.3 W

文章

59.0 W

点赞

回顶部