ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

OpenAI发布AI智能体Operator 支持简单在线任务

2025-01-27

数据:

OpenAI于2025年1月24日发布了其首款AI智能体Operator,能够执行简单在线任务。该系统由基于GPT-4o的新模型Computer-Using Agent(CUA)支持。当前仅服务于ChatGPT Pro的用户。

线索:

Operator可能带来新的投资机会,尤其是在自动化和人工智能领域,推动工作效率和日常任务的简化。另一方面,由于其隐私保护措施,市场对其安全性和合规性关注也可能影响投资信心。

正文:

OpenAI于2025年1月24日发布了首款AI智能体Operator。该智能体是一款能够在浏览器执行简单在线任务的应用,例如预订音乐会门票和在线订购杂货。Operator是由基于GPT-4o构建的新模型Computer-Using Agent(CUA)提供支持,目前仅对注册了ChatGPT Pro(每月200美元的高级服务)的美国用户开放,计划在未来扩展到其他用户。

CUA模型的强大源自其与图形用户界面(GUI)的交互能力,它展现了人类般的视觉能力,可以“看到”界面元素,同时具备通过强化学习获得的推理能力。在执行任务时,CUA的自我纠错能力尤其突出。当遇到难题或错误时,CUA能够自我调整;若遇到无法解决的情况,模型会将控制权交还给用户,以实现流畅的人机协作。

在安全性与隐私保护方面,Operator表现实属亮眼。OpenAI声明,Operator在运行期间不会利用用户与ChatGPT共享的数据,充分维护用户隐私。同时,名为“接管模式”的功能在输入支付信息或登录凭据时将要求用户手动完成,进一步保障安全。

CUA模型在任务执行中的成功率表现不俗,在OSWorld上达到了38.1%,WebArena为58.1%,而WebVoyager为87%。这表明CUA在各种环境中导航和操作的能力。

CUA的操作过程包括以下几个技术维度:

1. 视觉感知——屏幕截图分析以识别界面元素。

2. 操作规划——将复杂任务分解为小的子任务,并生成操作序列。

3. 执行操作——模拟人类的鼠标与键盘操作。

4. 自我纠错与学习——检测错误并进行回溯,利用强化学习不断优化交互策略。

OpenAI Operator的推出标志着AI发展的重要进展,使得模型能使用人类日常工具,为新应用的开发打开了大门。

发布时间:

2025-01-24 10:35:21

相关推荐

评论 ( 0 )

2.2 W

文章

13.9 W

点赞

回顶部