EN
 

运用GPT 3模型 研究人员研宣布能听懂英语指令并履行家务的机器人

发布时间:2024-01-07 15:07:52 作者: 乐鱼平台赞助大巴黎

  IT之家 5 月 14 日音讯,普林斯顿大学、斯坦福大学和谷歌的一组研究人员,运用 OpenAI 的 GPT-3 Davinci 模型,研宣布了一款能听懂英语指令并履行家务的机器人,名为 TidyBot。这款机器人能依据用户的喜爱,主动完结如分类洗衣服、捡起地上的废物、拾掇玩具等使命。

  GPT-3 Davinci 模型是一种深度学习模型,归于 GPT 模型系列的一部分,可以了解和生成自然言语。该模型具有强壮的总结才能,可以从很多的文本数据中学习杂乱的目标特点和联系。研究人员运用这种才能,让机器人依照每个用户供给的几个示例目标放置方位,如“黄色衬衫放在抽屉里,深紫色衬衫放在衣柜里,白色袜子放在抽屉里”,然后让模型总结出用户的一般偏好规矩,并应用到未来的交互中。

  研究人员在论文中写道:“咱们的根本见地是,LLM(大型言语模型)的总结才能与个性化机器人的泛化需求十分匹配。LLM 展现了经过总结完成泛化的惊人才能,运用从海量文本数据集中学习到的杂乱目标特点和联系。”

  他们还写道:“与需求贵重的数据搜集和模型练习的传统办法不同,咱们展现了 LLM 可以直接开箱即用地完成机器人范畴的泛化,运用它们从海量文本数据中学习到的强壮的总结才能。”

  研究人员在论文网站上展现了一个机器人,它可以将洗衣服分为淡色和深色,收回饮料罐,丢掉废物,拾掇包和餐具,将散落的物品放回原处,并将玩具放入抽屉。

  研究人员首要测验了一个根据文本的基准数据集,其间输入了用户偏好,并要求模型创立个性化规矩来确认物品归属。模型将示例总结为一般规矩,并运用总结来确认新物品的放置方位。基准场景界说在四个房间中,每个房间有 24 个场景。每个场景包括两到五个放置物品的当地,并且有相同数量的已见和未见物品供模型分类。他们写道,这个测验在未见物品上达到了 91.2% 的准确率。

  当他们将这种办法应用到实在国际的机器人 TidyBot 时,他们发现它可以成功地拾掇 85% 的物体。TidyBot 在八个实在场景中进行了测验,每个场景有一组十个物品,并在每个场景中运转机器人 3 次。据IT之家了解,除了 LLM,TidyBot 还运用了一个叫做 CLIP 的图画分类器和一个叫做 OWL-ViT 的物体检测器。

  佐治亚理工学院交互核算学院的助理教授徐丹飞(Danfei Xu)在谈到谷歌的 PaLM-E 模型时表明,LLM 使机器人具有更多的问题处理才能。“曾经的使命规划体系大多依赖于一些方式的查找或优化算法,这些算法不太灵敏,也很难构建。LLM 和多模态 LLM 使这些体系可以从互联网规划的数据中获益,并轻松地用于处理新问题。”他说。