谁买了这款熏鲑鱼?“人工智能代理”将如何改变互联网(和购物清单)
我正在看人工智能为我采购杂货。
它手持我的购物清单,输入每个项目到超市网站的搜索框中,然后用鼠标点击。看着这个似乎是数字幽灵的东西完成这个通常的琐事,让我感到有些着迷。“你确定这不是印度的某个人在操作吗?”我丈夫问,探头过来。我正在试用OpenAI的新AI“代理”——Operator,去年在英国用户中发布。它具有与ChatGPT相似的文本界面和对话风格,但不仅仅是回答问题,而是可以实际做事——只要这些事涉及到网络浏览。
紧随大型语言模型之后,AI代理被誉为下一个大事件,显而易见其吸引力:一个可以完成实际任务的数字助手,显然比一个只是能回应对话的助手更具吸引力。与OpenAI的产品类似,Anthropic去年年底也为其Claude聊天机器人引入了“计算机使用”能力。Perplexity和谷歌也在其AI助手中推出了“代理”功能,并有更多公司在开发专注于特定任务的代理,如编码或研究。
关于什么算作AI代理存在争论,但一般的观点是它们需要能够在某种程度上自主采取行动。“只要某个东西开始在聊天窗口之外执行动作,它就是从聊天机器人变成代理了,”AI公司Hugging Face的首席伦理科学家玛格丽特·米切尔(Margaret Mitchell)表示。
这是个早期阶段。大多数商业可用的代理都带有免责声明,表明它们仍处于实验阶段——OpenAI将Operator描述为“研究预览”。网上可以找到许多例子,展示它们犯有搞笑的错误,比如花31美元买了十二个鸡蛋,或试图将杂货送回它们购买的商店。根据你咨询的对象,代理可能只是下一个被夸大的科技玩具,或是一个可能震撼劳动力市场、重塑互联网并改变我们生活方式的AI未来的黎明。
“原则上,它们会很棒,因为它们可以自动化很多繁重的工作,”科学家和大型语言模型的批评者加里·马库斯(Gary Marcus)说。“但我认为它们在可预见的未来都无法可靠地工作,这部分是因为这是对虚假宣传的投资。”
我注册了Operator来看看自己。由于家里没有食物,采购杂货似乎是个不错的首个任务。我输入我的请求,它询问我是否有首选的商店或品牌。我告诉它随便选择最便宜的。一个窗口出现,显示一个网络浏览器,我看到它搜索“英国在线杂货配送”。光标选择了第一个结果:Ocado。它开始搜索我请求的商品,并按价格过滤结果。它选择产品并点击“加入购物车”。
我对Operator的主动性印象深刻;它没有问我太多问题,而是在给出简短的项目描述时做出决策,例如“鲑鱼”或“鸡肉”。当它搜索鸡蛋时,它成功地跳过了几个作为特价商品出现的非鸡蛋项目。我的清单要求“几种不同的蔬菜”:它选择了一颗西兰花,然后询问我是否想要其他具体的东西。我告诉它再选择两种,它选择了胡萝卜和韭葱——可能就是我自己会选的。鼓起勇气,我告诉它加上“一种甜点”,看它如何将“甜点”字面输入搜索框。我不明白它为何选择70%黑巧克力——肯定不是最便宜的选择——但我告诉它我不喜欢黑巧克力,它便将其换成了一块Galaxy巧克力。
我们遇到了一些麻烦,Operator意识到Ocado有最低消费,我于是添加了更多商品清单。然后它到了登录阶段,代理让我介入:虽然用户可以在任何时刻接管浏览器,但OpenAI表示Operator旨在“在输入敏感信息时请求这一点,比如登录凭据或支付信息”。虽然Operator通常会持续截屏以“查看”它正在做的事情,但OpenAI表示在用户接管时不会这样做。
在结账时,我试探性地让Operator完成支付。然而,当它回应询问我的卡信息时,我还是收回了控制权。我已经将支付信息给了OpenAI(Operator需要一个ChatGPT Pro账户,每月费用为200美元),但直接与AI分享这些信息让我感到不安。订单已下,我期待着第二天的配送。但这并没有解决晚餐的问题。我给Operator下了一个新任务:它能否为我从当地一家评价很高的餐馆订购一个芝士汉堡和薯条?它询问我的邮政编码,然后加载Deliveroo网站并搜索“芝士汉堡”。再次出现一个暂停,我必须登录,然而因为Deliveroo已经存储了我的卡信息,Operator可以直接进行支付。
它选择的餐馆是本地的,并且评价很高——实际上是一家炸鱼薯条店。我最终得到了一个还不错的芝士汉堡和一大包薯条。虽然并不是我想象中的,但也没有错。然而,当我意识到Operator跳过了给送餐员小费的步骤时,我感到很尴尬。我害羞地拿着我的食物,并事后给送餐员留了个慷慨的小费。
当然,看着Operator行动时让使用AI代理进行在线任务的省时特点变得无效。相反,你可以让它在后台工作,而你可以集中精力在其他页面上。在我撰写这篇文章时,我再次提出请求:它能为我在当地一家沙龙预约一个美甲吗?Operator在这个任务上更为挣扎。它转到美容预约平台Fresha,但当我看到它提示我登录时,我意识到它选择了一个晚于我想要日期一周的时间,并且距离我居住在东伦敦超过一个小时的车程。我指出这些问题,它找到了一个适合正确日期的时段,但在莱icester广场——依然距离较远。直到那时,它才询问我的位置,我意识到它在任务之间没有保留这个知识。到目前为止,我可以已经自己完成预约。最终,Operator建议了一个合适的预约,但我放弃了任务并把这算作人类的一场胜利。
显然,这一代AI代理还有局限性。不得不停下并登录需要相当多的人类监督,尽管Operator存储cookies以便用户在后续访问时保持登录(OpenAI表示在“特别敏感”的网站上,如邮件客户端或金融服务,它要求更严密的监督)。结果虽然通常准确,但并不总是符合我的心意。当我的杂货送到时,我发现Operator订购了熏鲑鱼而不是鱼片,还重复订购了酸奶,可能是因为有特价。在我意图买“一些鱼饼”的时候,它却解释为三个包装(我只打算要一个),而且由于该商品缺货,唯一使它免于买巧克力奶而不是原味奶的尴尬局面是它该商品缺货。公平地说,我有机会复查订单,如果我在我的提示中更具体(“一包两条生鲑鱼片”)我可能会得到更好的结果——但这些额外步骤也会减少节省的努力。
尽管目前存在缺陷,我对Operator的体验感觉就像是未来某种事物的前景。随着这些系统的改进和成本的降低,我可以很容易地看到它们成为日常生活的一部分。你可能已经在应用中写下了购物清单;那么为什么它也不能直接下单呢?代理还在超出个人助手的工作流程中渗透。OpenAI的首席执行官山姆·阿尔特曼(Sam Altman)预测,今年AI代理可能“加入劳动力”行列。
软件开发者是早期采用者之一;编码平台GitHub最近向其AI Copilot工具添加了代理能力。GitHub的首席执行官托马斯·多姆克(Thomas Dohmke)表示,开发者已经习惯某种程度的自动化帮助;与AI代理的不同之处在于自主性。“与您仅仅询问一个问题并给出答案不同,您给出一个问题,然后它与其访问的代码一起迭代该问题,”他说。
GitHub正在开发一个具有更大自主性的代理,它称之为项目Padawan(一个指代绝地学徒的《星球大战》术语)。这将允许AI代理异步工作,而不需要持续监督;开发者可以拥有数个代理为其工作,生成代码供其审核。多姆克表示,他并不认为开发者的工作会受到威胁,因为他们的技能将会变得越来越需要。“我想说,AI给大多数开发者增加的工作量比它接管的工作量更大。”代理也可能使诸如构建应用之类的编码任务变得更加便利,甚至让非技术人员易于使用。
米切尔警告,随着代理的自主性提升,它们带来的风险也在增加。她与Hugging Face联合撰写的一篇论文对完全自主代理的发展表示担忧。“完全自主意味着人人控制权完全被放弃,”她说。与在设定边界内工作不同,完全自主代理可能接触到你未意识到的内容,或者表现出意想不到的方式,尤其是如果它可以自己编写代码。AI代理错误下单取外卖不是大问题,但如果它开始将你的个人信息传播至欺诈网站,或者在你的名义下发布可怕的社交媒体内容那该怎么办?高风险职场可能会引入特别危险的情景:如果它能够访问导弹指挥系统那又该如何?
米切尔希望技术人员、立法者和政策制定者能够激励设置保护措施以降低此类事件的发生。目前,她预见代理能力将在特定任务上变得更加成熟。她说,我们很快将看到代理与代理之间的交互——例如,你的代理可以和我的代理一起安排会议。
代理的涌现将可能重塑互联网。目前,互联网上大量信息是专门为人类语言设计的,但如果AI越来越多地与网站互动,这种情况可能会有所改变。“我们会看到越来越多的信息通过互联网可得,而这些信息并不是直接的人类语言,而是代理可以采取行动所必需的信息,”米切尔表示。
多姆克附和这个观点。他认为,主页的概念将失去重要性,界面将以AI代理为设计基础。品牌可能开始与AI竞争以吸引注意力,而不是人类的眼球。
有一天,代理甚至可能逃脱计算机的束缚。我们可能会看到AI代理被赋予机器人形态,这将为它们帮助完成物理任务打开一个全新的世界。“我的预测是,我们将会看到可以为我们洗衣服、洗碗和做早餐的代理,”米切尔说。“只要不要让它们接触武器便好。”
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
谁买了这款熏鲑鱼?“人工智能代理”将如何改变互联网(和购物清单)
install_url
to use ShareThis. Please set it in _config.yml
.