据报道,OpenAI 计划本周推出名为 Operator 的计算机操作代理系统,该系统能够在用户的网络浏览器中代为完成各项任务。包括 Google 和 Anthropic 在内的其他公司也在开发类似的"代理"系统,他们希望这将成为 AI 实现取代人工任务承诺的重要突破。 据最早报道这一消息的 The Information 称,Operator 将为用户提供旅行、餐饮和活动等类别的建议提示。例如,用户可以要求 Operator 帮忙查找从纽约到茂宜岛的合适航班,避免深夜到达。不过,Operator 不会完成实际交易——用户仍需参与并自行完成支付过程。 Operator 的潜在应用场景很容易想象。比如,不熟悉电脑操作的老年人可以请 Operator 协助发送电子邮件,它会自动打开 Gmail 并创建新邮件。虽然技术精通的人不需要这种帮助,但老一辈人往往在网络浏览和基本任务操作上都面临挑战。机器人还可以在其他领域发挥作用,例如帮助公司测试新网站或服务的质量保证工作。 然而,这类"计算机使用代理"也存在潜在风险。我们已经看到有初创公司推出网络导航机器人,用于在网上上自动发布营销垃圾信息。这些能够控制终端用户客户端的机器人可以绕过防自动化的 API 限制。因此,AI 初创公司需要采取措施防止滥用,否则网站将比现在更加充斥垃圾信息。 Operator 这类代理系统的工作原理是通过捕获用户浏览器的屏幕截图并发送给 OpenAI 进行分析。一旦其模型确定完成任务的下一步骤,就会向浏览器发送指令,控制鼠标移动点击特定目标或在输入框中输入内容。这项功能借助了 OpenAI 等公司开发的多模态技术,能够同时处理文本和图像等多种形式的输入。 近期涌现的 AI 初创公司都承诺要开发出能在大多数任务上替代人类的通用人工智能 (AGI),提高所有人的生活效率。随着语言模型性能提升速度放缓,这些公司正在寻找新的突破口,计算机使用代理就是其中之一。因为真正要替代人类,AI 必须能够实际完成任务——写作只是任务的一部分,机器人还需要能够操作电子表格、观看视频等。 Anthropic 发布其计算机使用机器人的初步预览后,早期测试者反映该系统还很不成熟:当遇到不知如何处理的情况时会陷入循环,有时甚至会忘记原定任务,转而做完全无关的事情,比如在 Google Images 上浏览自然风景照片。而且系统运行速度慢,运营成本高。 考虑到这类机器人被赋予了高级别的控制权限和关键数据访问权限,保持人类参与至关重要。计算机使用代理的发展轨迹可能会类似于自动驾驶汽车:Google 很快就实现了直道自动驾驶,但解决各种边缘情况却花费了多年时间。 关于如何衡量和判定 AGI 何时"实现"仍有争议。OpenAI 告诉其最大投资方 Microsoft,它认为一旦创造出能产生至少 1000 亿美元利润的 AI 系统,就算实现了 AGI。考虑到 OpenAI 预计 2025 年的收入为 120 亿美元且仍在亏损数十亿美元,这个目标相当远大。 同时,Microsoft 和 Google 发现企业客户采用 AI 工具的速度不及预期。这两家公司原本计划每位员工收取 20-30 美元的 AI 工具附加费用,现在却转而将 AI 功能整合进标准套餐,仅小幅提高套餐价格。 © AI范儿 要进“交流群”,请关注公众号获取进群方式 投稿、需求合作或报道请添加公众号获取联系方式 震惊!AI 可以自主操作电脑了,大家担心的事情提前发生了 点这里关注我,记得标星哦~ |