时间: 2025-03-04 10:23:20 | 作者: 电机
鞭牛士报导,1月21日音讯,据外电报导,OpenAI 或许行将发布一款能操控你的电脑并代表你履行操作的 AI 东西。
蒂博尔·布拉霍 (Tibor Blaho) 是一位以精确走漏行将推出的 AI 产品而出名的软件工程师,他宣称发现了 OpenAI 风闻已久的Operator东西的依据。
彭博社等出版物此前曾报导过 Operator,听说它是一个署理体系,能够自主处理编写代码和预定游览等使命。
Blaho 标明, OpenAI 的macOS ChatGPT客户端已取得现在躲藏的选项,用于界说切换操作符和强制退出操作符的快捷方式。
Blaho 标明,OpenAI 已在其网站上添加了对操作符的引证 — — 虽然这些引证没有揭露。
已承认 - ChatGPT macOS 桌面应用程序具有躲藏选项,可界说桌面发动器的快捷方式“切换操作员”和“强制退出操作员” 蒂博尔·布拉霍 (@btibor91) 2025 年 1 月 19 日
Blaho 标明,OpenAI 的网站还包含没有揭露的表格,比较了 Operator 与其他运用计算机的 AI 体系的功用。这些表格很或许仅仅占位符。但假如这些数字精确,则标明 Operator 并非 100% 牢靠,详细取决于使命。
在 OSWorld(一个企图模仿实在计算机环境的基准测验)上,「OpenAI 计算机运用署理 (CUA)」——或许是为 Operator 供给支撑的 AI 模型——得分为 38.1%,高于 Anthropic 的计算机操控模型,但远低于人类的 72.4%。
OpenAI CUA 在 WebVoyager 上的体现超过了人类,WebVoyager 评价了 AI 导航和与网站交互的才能。但依据走漏的基准测验,该模型在另一个根据网络的基准测验 WebArena 上得分低于人类水平。
假如走漏的音讯事实,Operator 还难以完结人类能够轻轻松松完结的使命。在一项要求 Operator 与云供给商签约并发动虚拟机的测验中,Operator 的成功率只要 60%。
OpenAI 行将进入人工智能署理范畴,而此前说到的 Anthropic、谷歌等竞争对手也正在抢夺这一新式范畴。人工智能署理有几率存在危险和投机性,但科技巨子们现已将其吹捧为AI范畴的下一个大抢手。
当今的功用还很原始。但一些专家忧虑,假如技能敏捷前进,他们的安全就会遭到要挟。
其间一张走漏的图表显现,Operator 在选定的安全评价中体现杰出,包含企图让体系履行非法活动和查找灵敏个人数据的测验。
据报导,安全测验是 Operator 开发周期较长的原因之一。在最近的 X帖子中,OpenAI 联合发起人 Wojciech Zaremba 批判 Anthropic 发布了一个他宣称缺少安全缓解办法的署理。
Zaremba 写道:我只能幻想假如 OpenAI 发布相似版别会引起什么负面反响。
值得注意的是,OpenAI 遭到了包含前职工在内的AI研究人员的批判,据称他们为了快速将其技能产品化而忽视了安全作业。