本文转自:参考消息网
参考消息网9月30日报道 据英国《金融时报》网站9月25日报道,谷歌深层思维公司公布了进一步提升机器人推理能力的人工智能(AI)模型,从而使机器人能够解决更困难的问题和完成更复杂的现实世界任务,如将待洗衣物进行分类和回收垃圾等。
该公司名为“双子座机器人技术1.5”和“双子座机器人技术-具身推理1.5”的两款新模型旨在帮助机器人通过先“思考”后行动的方式完成多步骤任务,这是科技业推动通用机器人在日常生活中获得更广泛应用努力的一部分。
据谷歌深层思维公司称,使用其新模型训练的机器人能够规划如何完成需耗时数分钟的任务,例如根据颜色把待洗衣物放入不同的篮子中。
这一进展的出现,正值包括开放人工智能研究中心(OpenAI)和特斯拉在内的科技公司竞相把AI模型集成到机器人中,希望它们能够改变从医疗保健到制造业等一系列行业。
谷歌深层思维公司高级总监、机器人业务主管卡罗琳娜·帕拉达说:“迄今为止的模型可以十分出色地完成一次执行一项指令的任务,而我们现在正从执行单项指令转向对现实任务的真正理解和问题解决阶段。”
今年3月,谷歌深层思维公司曾公布这两款模型的初代版本,它们采用了谷歌“双子座2.0”系统以帮助机器人适应各种新情况,对口头指令或环境变化作出快速响应,并具备足以操纵物体的灵巧度。
初代版本能够思考完成诸如折叠纸张或拉开袋子等任务的方式,而最新模型可以执行一系列指令,并且还能利用诸如谷歌搜索之类工具的帮助来解决问题。
在一项演示中,该公司研究人员要求一台机器人把一顶针织帽装进她的旅行包,以备前往伦敦时之用。机器人还能告知她在伦敦逗留期间将会下雨,因此在她的包里装了一把雨伞。
这台机器人还能对垃圾进行分类并放入相应的回收箱中。它先是利用在线工具确定自己身处旧金山,然后在网上搜索该市的垃圾回收指南。
“双子座机器人技术1.5”是一款视觉-语言-动作模型,它结合多种不同的信息输入并把它们转化为动作。这两款系统都能通过从互联网下载的数据了解世界。
牛津大学应用人工智能教授英马尔·波斯纳表示,利用这种互联网规模的数据学习可以帮助机器人技术实现某种“ChatGPT时刻”。
但曼彻斯特机器人技术和人工智能中心联合主任安杰洛·坎杰洛西提醒人们,不要把这些机器人所做的事情称作真正的思考。他说:“这只是在发现像素、图像、词语、标记及诸如此类的事物之间的规律性而已。”
谷歌深层思维公司新系统的另一项新进展是一种被称为“动作转移”的技术,它可以让一个AI模型使用专为某一特定类型的机器人实体(如机械臂)设计的技能,并将其转移至另一类型的机器人(如人形机器人)身上。
传统上,要让机器人在某个空间内移动并作出行动,需要大量细致的规划和编码,而且这种训练通常专门针对如机械臂等某一特定类型机器人。这项“动作转移”突破可以帮助解决AI机器人技术发展中的一个主要瓶颈,即训练数据不足。
谷歌深层思维公司机器人业务首席软件工程师卡尼什卡·拉奥说:“跟可以利用整个互联网上的庞大数据进行训练的大语言模型不同,机器人技术一直受限于收集真实数据的繁琐过程。”
该公司称自己还需要克服若干技术障碍,其中包括让机器人形成通过观看人类完成任务的视频来学习技能的能力。
该公司还表示,在机器人可以被广泛部署到能够与人类互动的环境中之前,它们还需要变得更加灵巧、可靠和安全。拉奥说:“建造通用机器人的主要挑战之一在于,对人类来说可以凭直觉学会的东西,对机器人来说实际上却相当困难。”(编译/曹卫国)
迎尚网提示:文章来自网络,不代表本站观点。