新数据集助力训练家用机器人执行人类指令

亚马逊科学团队公开发布的TEACh数据集包含来自模拟环境的3000多组对话及关联视觉数据,旨在推动能完成复杂家务任务的AI助手研发。

数据集概览

  • 数据规模:4365个采集会话中,成功回放3047个
  • 环境构成:基于AI2-THOR模拟器的30种厨房及多数客厅/卧室/浴室变体
  • 交互特性:包含45,000余条对话,平均每会话8.4条用户指令和5.25条机器人响应
  • 操作能力:支持拾取/放置、开关橱柜、操作电器、液体倾倒等20余种物体交互动作

技术实现

  1. 任务定义语言:通过属性验证机制判定任务完成状态(如检测"存在装满咖啡的干净杯子")
  2. 众包采集:双工作者分别扮演用户和机器人角色,通过网页界面在模拟环境中协作
  3. 动态交互:支持非结构化对话,包含过早/过晚指令、纠错指导等真实交互场景

三大基准测试

  1. EDH(基于对话历史的执行)

    • 输入:对话历史+机器人动作序列
    • 输出:预测后续动作并验证环境状态改变
    • 应用:Alexa Prize SimBot挑战赛基准
  2. TfD(基于对话的轨迹预测)

    • 输入:完整对话记录
    • 输出:重建机器人全部动作序列
  3. TATC(双代理任务完成)

    • 需构建用户模型(生成指令)和机器人模型(执行动作)的协同系统

验证架构

  • 可见分割(validation-seen/test-seen):评估训练房间内的泛化能力
  • 未见分割(validation-unseen/test-unseen):测试新场景适应能力
  • 兼容ALFRED数据集迁移学习

该数据集已开源并配套发布arXiv技术论文,为具身智能体研究提供新基准。研究团队特别感谢30余位Alexa AI组成员的贡献。

更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

公众号二维码

亚马逊发布TEACh数据集训练家用机器人的更多相关文章

  1. [转帖]亚马逊发布自主64核心ARM处理器:单核性能远超铂金至强

    亚马逊发布自主64核心ARM处理器:单核性能远超铂金至强 https://news.mydrivers.com/1/660/660383.htm 不知道真假 看样子比华为的鲲鹏920 要牛B . 亚马 ...

  2. 亚马逊云推出基于机器学习的企业搜索服务Kendra,剑指微软

    近日,在AWS re:Invent全球大会上,亚马逊发布了五项新的基于机器学习的人工智能 (AI) 服务. 这五项服务包括机器学习驱动的企业搜索.代码审核与分析.欺诈检测.医疗转录和 AI 预测的人工 ...

  3. 亚马逊6月18日发布惊世之作 或为3D智能手机

    亚马逊将在 6 月 18 日举行一个产品发布会. 其内容可能是关于传闻已久的亚马逊智能手机.该公司在 YouTube 上公布了一段炫耀这款设备的视频.这段视频展示了很多人在这款产品前摇头晃脑,并且表现 ...

  4. 微软、谷歌、亚马逊、Facebook等硅谷大厂91个开源软件盘点(附下载地址)

    开源软件中有大量专家构建的代码,大大节省了开发人员的时间和成本,热衷于开源的大厂们总是能够带给我们新的惊喜.2016年9月GitHub报告显示,GitHub已经有超过 520 万的用户和超 30 万的 ...

  5. Google、亚马逊、微软 、阿里巴巴开源软件一览

    Google.亚马逊.微软 .阿里巴巴开源软件一览 大公司为什么要发布开源项目?一是开源能够帮助他人更快地开发软件,促进世界创新,主要是社会价值层面的考虑.二是开源能够倒逼工程师写出更好的代码.三是开 ...

  6. Amazon EMR(Elastic MapReduce):亚马逊Hadoop托管服务运行架构&Hadoop云服务之战:微软vs.亚马逊

    http://s3tools.org/s3cmd Amazon Elastic MapReduce (Amazon EMR)简介 Amazon Elastic MapReduce (Amazon EM ...

  7. 完全基于 Java 的开源深度学习平台,亚马逊的大佬带你上手

    本文适合有 Java 基础的人群 作者:DJL-Lanking HelloGitHub 推出的<讲解开源项目>系列.有幸邀请到了亚马逊 + Apache 的工程师:Lanking( htt ...

  8. 亚马逊DRKG使用体验

    基于文章:探索「老药新用」最短路径:亚马逊AI Lab开源大规模药物重定位知识图谱DRKG,记录了该项目的实际部署与探索过程,供参考. 1. DRKG介绍 大规模药物重定位知识图谱 Drug Repu ...

  9. 亚马逊云科技现身世界人工智能大会,揭示AI最新技术趋势

    2022世界人工智能大会(WAIC)于日前落幕.经过过去四届的发展与沉淀,今天的世界人工智能大会已成为人工智能领域最有影响力的国际盛会之一,今年大咖云集.国际大厂扎堆,充分彰显了大会的国际影响力和磁力 ...

  10. 继GitHub的Copilot收费后,亚马逊推出了 CodeWhisperer,感觉不错哟!

    Copilot 是 Github 推出的一款人工智能编程助手,推出仅一年就受到大量开发者的追捧(据官方统计有 120 万用户).然而,自 2022 年 6 月起,它改为了付费订阅模式(每月 10 美元 ...

随机推荐

  1. 鸿蒙NEXT(三):从TypeScript到ArkTS的适配详解

    @charset "UTF-8"; .markdown-body { line-height: 1.75; font-weight: 400; font-size: 15px; o ...

  2. JavaScript编程的10+最佳实践解决方案

    @charset "UTF-8"; .markdown-body { line-height: 1.75; font-weight: 400; font-size: 15px; o ...

  3. RocketMQ高级使用

    消息存储 分布式队列因为有高可靠性的要求,所以数据要进行持久化存储. 消息生成者发送消息 MQ收到消息,将消息进行持久化,在存储中新增一条记录 返回ACK给生产者 MQ push 消息给对应的消费者, ...

  4. CI框架–头信息,构造器,视图

    今天继续学习CI框架的相关知识,分析下面语句,将匹配到的用户,Location跳转至相应界面,header()函数用来向客户端发送原始HTTP报头. `if ($this->user ['uid ...

  5. Go Gob编码

    gob(Go binary)是Goland包自带的一个数据结构序列化的编码/解码工具.编码使用Encoder,解码使用Decoder.一种典型的应用场景就是RPC(remote procedure c ...

  6. Ribbon过滤器原理解析

    Ribbon过滤器整体看是一个矩阵构建与矩阵乘法,RocksDB中对它的实现是进行了合理的空间.时间上的优化的. 符号 整个过滤器都和矩阵计算CS=R相关,C是\(n*n\)矩阵,S是\(n*m\)矩 ...

  7. python学习思维导图分享

    python 本文包含了我的一些python学习的笔记和思维导图 第一部分:python基础 导图下载链接 第二部分:函数及其他文件操作 导图下载链接 第三部分:类及网络编程 导图下载链接 第四部分: ...

  8. 资源类型Scheme

    资源类型Scheme 1.介绍 当我们操作资源和 apiserver 进行通信的时候,需要根据资源对象类型的 Group.Version.Kind 以及规范定义.编解码等内容构成 Scheme 类型, ...

  9. AI时代Hello World详细教程之LLM微调(SFT)

    [00]时代变了 移动互联网时代的Hello World(参见Xamarin 使用极光推送 详细教程 ),安装某一套开发工具包(IDE)就够了,AI时代就明显要的就多了. 依然直奔主题,无废话,直接上 ...

  10. 一文详解如何在 ChengYing 中通过产品线部署一键提升效率

    在之前的内容当中,我们为大家介绍过 ChengYing的安装原理.产品包制作等内容,本篇就延续之前的内容,和大家展开聊聊 ChengYing 产品线部署相关的设计.帮助对「一站式全自动化全生命周期大数 ...