当前位置: 首页 > 新闻动态 > AI营销

刚刚,OpenAI正式放出智能体Operator!能推理、联网自主执行任务

作者:聖光之護 浏览: 发布日期:2025-01-24
[导读]:OpenAI发布Operator:能联网自动执行任务的AI智能体,引发AI社区热议!北京时间昨天傍晚,继“星际之门项目”后,OpenAI再次成为AI领域的焦点。ChatGPTPro用户发现界面新增“Operator”选项,引发猜测:OpenAI的计算机使用智能体来了吗?这一消息导致ChatGPT访问量激增,服务器不堪重负,短暂宕机约3小时。凌晨,OpenAI正式发布Operator及底层模型Agents。Operator现为研究预览版智能体,可访问互联网自动执行任务,OpenAI计划将其整

openai发布operator:能联网自动执行任务的ai智能体,引发ai社区热议!

北京时间昨天傍晚,继“星际之门项目”后,OpenAI再次成为AI领域的焦点。ChatGPT Pro用户发现界面新增“Operator”选项,引发猜测:OpenAI的计算机使用智能体来了吗?

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

这一消息导致ChatGPT访问量激增,服务器不堪重负,短暂宕机约3小时。 凌晨,OpenAI正式发布Operator及底层模型Agents。

Operator现为研究预览版智能体,可访问互联网自动执行任务,OpenAI计划将其整合到ChatGPT中。目前仅限美国Pro用户使用。

虽然计算机使用型AI并非新鲜事物(Anthropic去年10月已发布类似功能,国内智谱的GLM-PC也已开放体验),Operator的发布仍引发热议——毕竟这是OpenAI。OpenAI总裁Greg Brockman再次强调:2025年是智能体之年。

部分Pro用户已分享使用案例,例如:根据图片和菜谱订购食材、规划旅行路线、研究投资等。 当然,也有不少调侃之声。

Operator功能演示及技术解读

Operator界面如下:

Operator由名为“计算机使用智能体”(CUA)的新模型驱动,结合GPT-4o的视觉能力和强化学习的高级推理能力,可与图形用户界面(GUI)交互。

Operator可“查看”(通过截图)和“交互”(使用鼠标键盘)浏览器,无需自定义API即可在网页上操作。 它能自我纠错,并在遇到困难时将控制权交还给用户。

演示功能包括:餐厅预订、根据手写购物单购物、订票等。

CUA模型结合多模态理解和推理,将任务分解为多步骤规划,并能自适应纠错。这标志着AI发展的新阶段,允许模型使用人类常用的工具,并开启大量新应用。

CUA工作原理

CUA通过处理原始像素数据理解屏幕内容,并使用虚拟鼠标和键盘操作。它能处理多步骤任务、错误和意外变化,无需专用API即可在多种数字环境中运行,执行填写表格、浏览网站等任务。

CUA通过感知、推理和行动的迭代循环操作:

  • 感知:屏幕截图作为模型上下文,提供当前状态的视觉快照;
  • 推理:使用链式推理后续步骤,考虑当前和过去的截图及操作;
  • 行动:执行操作,直到任务完成或需要用户输入。它会主动请求用户确认敏感操作。

CUA仍处于早期阶段,但已取得SOTA基准测试结果:OSWorld (38.1%),WebArena (58.1%),WebVoyager (87%)。

使用方法、生态系统及安全隐私

Operator使用简单,用户描述任务即可。用户可随时接管,Operator也会主动请求用户输入敏感信息。 可添加自定义指令,保存常用提示词,并同时运行多个任务。

OpenAI已与DoorDash、Instacart等企业合作。 Operator采用三层安全机制:用户控制、数据隐私管理和恶意网站防御。

未来计划包括:通过API开放CUA模型、增强功能和扩展用户群体。

参考链接:

https://www./link/528eb47b936c737fcfdec8b5f6aa3dd0

https://www./link/8a5bfb060ee1f97ecba56d60c049b52d

免责声明:转载请注明出处:http://m.lexweb.cn/news/232420.html

扫一扫高效沟通

多一份参考总有益处

免费领取网站策划SEO优化策划方案

请填写下方表单,我们会尽快与您联系
感谢您的咨询,我们会尽快给您回复!