运用GPT 3模型研究人员研宣布能听懂英语指令并履行家务的机器人_乐鱼平台赞助大巴黎

运用GPT 3模型研究人员研宣布能听懂英语指令并履行家务的机器人

发布时间：2024-01-07 15:07:52 作者: 乐鱼平台赞助大巴黎

IT之家 5 月 14 日音讯，普林斯顿大学、斯坦福大学和谷歌的一组研究人员，运用 OpenAI 的 GPT-3 Davinci 模型，研宣布了一款能听懂英语指令并履行家务的机器人，名为 TidyBot。这款机器人能依据用户的喜爱，主动完结如分类洗衣服、捡起地上的废物、拾掇玩具等使命。

GPT-3 Davinci 模型是一种深度学习模型，归于 GPT 模型系列的一部分，可以了解和生成自然言语。该模型具有强壮的总结才能，可以从很多的文本数据中学习杂乱的目标特点和联系。研究人员运用这种才能，让机器人依照每个用户供给的几个示例目标放置方位，如“黄色衬衫放在抽屉里，深紫色衬衫放在衣柜里，白色袜子放在抽屉里”，然后让模型总结出用户的一般偏好规矩，并应用到未来的交互中。

研究人员在论文中写道：“咱们的根本见地是，LLM（大型言语模型）的总结才能与个性化机器人的泛化需求十分匹配。LLM 展现了经过总结完成泛化的惊人才能，运用从海量文本数据集中学习到的杂乱目标特点和联系。”

他们还写道：“与需求贵重的数据搜集和模型练习的传统办法不同，咱们展现了 LLM 可以直接开箱即用地完成机器人范畴的泛化，运用它们从海量文本数据中学习到的强壮的总结才能。”

研究人员在论文网站上展现了一个机器人，它可以将洗衣服分为淡色和深色，收回饮料罐，丢掉废物，拾掇包和餐具，将散落的物品放回原处，并将玩具放入抽屉。

研究人员首要测验了一个根据文本的基准数据集，其间输入了用户偏好，并要求模型创立个性化规矩来确认物品归属。模型将示例总结为一般规矩，并运用总结来确认新物品的放置方位。基准场景界说在四个房间中，每个房间有 24 个场景。每个场景包括两到五个放置物品的当地，并且有相同数量的已见和未见物品供模型分类。他们写道，这个测验在未见物品上达到了 91.2% 的准确率。

当他们将这种办法应用到实在国际的机器人 TidyBot 时，他们发现它可以成功地拾掇 85% 的物体。TidyBot 在八个实在场景中进行了测验，每个场景有一组十个物品，并在每个场景中运转机器人 3 次。据IT之家了解，除了 LLM，TidyBot 还运用了一个叫做 CLIP 的图画分类器和一个叫做 OWL-ViT 的物体检测器。

佐治亚理工学院交互核算学院的助理教授徐丹飞（Danfei Xu）在谈到谷歌的 PaLM-E 模型时表明，LLM 使机器人具有更多的问题处理才能。“曾经的使命规划体系大多依赖于一些方式的查找或优化算法，这些算法不太灵敏，也很难构建。LLM 和多模态 LLM 使这些体系可以从互联网规划的数据中获益，并轻松地用于处理新问题。”他说。

上一条：研究人员研宣布能听懂英语指令并履行家务的机器人返回列表下一条：衣柜定制预算攻略欧铂丽全屋定制揭秘价格与计算秘籍

运用GPT 3模型 研究人员研宣布能听懂英语指令并履行家务的机器人

运用GPT 3模型研究人员研宣布能听懂英语指令并履行家务的机器人