OpenAI发布AI智能体Operator 支持简单在线任务

2025-01-27

数据：

OpenAI于2025年1月24日发布了其首款AI智能体Operator，能够执行简单在线任务。该系统由基于GPT-4o的新模型Computer-Using Agent（CUA）支持。当前仅服务于ChatGPT Pro的用户。

线索：

Operator可能带来新的投资机会，尤其是在自动化和人工智能领域，推动工作效率和日常任务的简化。另一方面，由于其隐私保护措施，市场对其安全性和合规性关注也可能影响投资信心。

正文：

OpenAI于2025年1月24日发布了首款AI智能体Operator。该智能体是一款能够在浏览器执行简单在线任务的应用，例如预订音乐会门票和在线订购杂货。Operator是由基于GPT-4o构建的新模型Computer-Using Agent（CUA）提供支持，目前仅对注册了ChatGPT Pro（每月200美元的高级服务）的美国用户开放，计划在未来扩展到其他用户。

CUA模型的强大源自其与图形用户界面（GUI）的交互能力，它展现了人类般的视觉能力，可以“看到”界面元素，同时具备通过强化学习获得的推理能力。在执行任务时，CUA的自我纠错能力尤其突出。当遇到难题或错误时，CUA能够自我调整；若遇到无法解决的情况，模型会将控制权交还给用户，以实现流畅的人机协作。

在安全性与隐私保护方面，Operator表现实属亮眼。OpenAI声明，Operator在运行期间不会利用用户与ChatGPT共享的数据，充分维护用户隐私。同时，名为“接管模式”的功能在输入支付信息或登录凭据时将要求用户手动完成，进一步保障安全。

CUA模型在任务执行中的成功率表现不俗，在OSWorld上达到了38.1%，WebArena为58.1%，而WebVoyager为87%。这表明CUA在各种环境中导航和操作的能力。

CUA的操作过程包括以下几个技术维度：

1. 视觉感知——屏幕截图分析以识别界面元素。

2. 操作规划——将复杂任务分解为小的子任务，并生成操作序列。

3. 执行操作——模拟人类的鼠标与键盘操作。

4. 自我纠错与学习——检测错误并进行回溯，利用强化学习不断优化交互策略。

OpenAI Operator的推出标志着AI发展的重要进展，使得模型能使用人类日常工具，为新应用的开发打开了大门。

发布时间：

2025-01-24 10:35:21

OpenAI发布AI智能体Operator 支持简单在线任务

相关推荐

评论 ( 0 )

取消回复

OpenAI发布AI智能体Operator 支持简单在线任务

相关推荐

评论 ( 0 )

取消回复

ReadCai财经资讯站