LeRobot v0.4.0 正式发布:全面提升开源机器人的学习能力
我们非常高兴地宣布,LeRobot 迎来一系列重大升级,让开源的机器人学习比以往更强大、更可扩展、也更易用!从重构的数据集到灵活的编辑工具、新的仿真环境,以及面向硬件的全新插件系统,LeRobot 正在持续演进,以满足前沿具身智能 (Embodied AI) 不断发展的需求。
简要总结
LeRobot v0.4.0 为开源机器人领域带来重要升级:引入可扩展的 Datasets v3.0、强大的新 VLA (视觉-语言-动作) 模型如 PI0.5 与 GR00T N1.5,以及全新的插件系统,简化硬件集成。该版本还新增对 LIBERO 与 Meta-World 仿真的支持、简化多 GPU 训练,并上线全新的 Hugging Face 机器人学习课程。
数据集:为下一波大规模机器人学习做好准备
我们彻底重构了数据集基础设施,推出 LeRobotDataset v3.0,采用全新的分块式 Episode 格式与流式读取能力。这对于处理超大规模数据集 (如 OXE (Open X Embodiment) 与 Droid) 是一次范式跃迁,带来前所未有的效率与可扩展性。
Datasets v3.0 有何新变化?
- 分块式 Episodes,面向超大规模:新格式支持 OXE 量级 (> 400 GB) 的数据集,显著提升可扩展性。
 - 高效视频存储与流式读取:更快的加载速度与顺畅的视频数据流式访问。
 - 统一的 Parquet 元数据:告别分散的 JSON!所有 Episode 的元数据现统一存放于结构化的 Parquet 文件中,便于管理与访问。
 - 更快的加载与更好的性能:显著缩短数据集初始化时间,内存使用更高效。
 
我们还提供了转换脚本,帮助你将现有 v2.1 数据集一键迁移到新的 v3.0 格式,确保平滑过渡。更多细节可阅读我们此前的 博客文章。开源机器人的学习能力持续升级中!
新特性:数据集编辑工具!
使用 LeRobot 数据集从未如此轻松!我们新增了一套强大的数据集灵活编辑工具。
借助全新的命令行工具 lerobot-edit-dataset,你可以:
- 从现有数据集中删除指定的 Episodes。
 - 按比例或 Episode 索引拆分数据集。
 - 轻松添加或移除特征字段。
 - 将多个数据集合并为一个统一数据集。
 
# 将多个数据集合并为单一数据集
lerobot-edit-dataset \
    --repo_id lerobot/pusht_merged \
    --operation.type merge \
    --operation.repo_ids "['lerobot/pusht_train', 'lerobot/pusht_val']"
# 删除部分 episodes 并保存为新数据集(保留原数据集)
lerobot-edit-dataset \
    --repo_id lerobot/pusht \
    --new_repo_id lerobot/pusht_after_deletion \
    --operation.type delete_episodes \
    --operation.episode_indices "[0, 2, 5]"
这些工具将大幅简化你的工作流,让你以前所未有的方式策划与优化机器人数据集。更多详情请查阅 文档!
仿真环境:扩展你的训练场
我们持续扩展 LeRobot 的仿真能力,为你的机器人策略提供更丰富、更多样化的训练环境。

LIBERO 支持
LeRobot 现已正式支持 LIBERO——这是 VLA (视觉-语言-动作) 策略中规模最大的开源基准之一,涵盖超过 130 个任务!这一步为打造 VLA 策略的首选评测枢纽奠定了基础,提供便捷的集成方式与统一的评测配置。
前往查看 LIBERO 数据集 与我们的 文档 开始上手!
Meta-World 集成
我们已集成 Meta-World,它是评测机器人操作多任务与泛化能力的一流基准,包含 50+ 种多样化的操作任务。配合我们对 gymnasium ≥ 1.0.0 与 mujoco ≥ 3.0.0 的标准化使用,这一集成为确定性的随机种子与稳健的仿真基础提供了保障。
立即使用 Meta-World 数据集 训练你的策略吧!
代码库:人人可用的强力工具
我们让机器人控制更加灵活与易用,解锁数据采集与模型训练的新可能。
全新的数据处理 Pipeline
让数据从机器人流向模型 (再流回去!) 并不容易。原始传感器数据、关节位置与语言指令,与人工智能模型期望的输入并不一致。模型需要在正确设备上的规范化、按批次的张量,而你的机器人硬件则需要特定格式的动作命令。
我们很高兴地推出 Processors:一个模块化的数据处理 Pipeline,可充当通用的“数据翻译器”。你可以把它想象为一条装配线,每个 ProcessorStep 只处理一个明确的工序——例如归一化、文本 Token 化、或将数据移到 GPU。
你可以将这些步骤串联起来,构建强大的 Pipeline,精准管理你的数据流。我们还提供了两类开箱即用的 Pipeline,进一步降低使用门槛:
PolicyProcessorPipeline:面向模型。专为高性能训练与推理处理按批次的张量。RobotProcessorPipeline:面向硬件。以单条数据 (如单次观测或动作) 为粒度,服务于实时机器人控制。
# 获取环境状态
obs = robot.get_observation()
# 重命名、打批、归一化、文本分词、移动到设备 ...
obs_processed = preprocess(obs)
# 推理
action = model.select_action(obs_processed)
# 反归一化、移动设备 ...
action_processed = postprocess(action)
# 执行动作
robot.send_action(action_processed)
这个系统让任何策略与任何机器人都能简单互联,确保你的数据在每一步都处于“刚刚好”的格式。详情可阅读我们的 Processors 入门文档。
多 GPU 训练更简单
大规模机器人策略的训练现在更快了!我们将 Accelerate 直接整合进训练 Pipeline,只需 一条命令 即可在多块 GPU 上无缝扩展你的实验:
accelerate launch \
  --multi_gpu \
  --num_processes=$NUM_GPUs \
  $(which lerobot-train) \
  --dataset.repo_id=${HF_USER}/my_dataset \
  --policy.repo_id=${HF_USER}/my_trained_policy \
  --policy.type=$POLICY_TYPE \
  # ... 更多训练配置参数
无论是对策略进行微调,还是开展大规模实验,LeRobot 现在都能替你处理分布式训练的全部复杂性。这意味着你可以大幅缩短训练时间:约 2 块 GPU 可减半,约 3 块 GPU 可降至三分之一,更多 GPU 效率更高。
查阅 文档 加速你的机器人学习!
策略:释放开放世界泛化能力

PI0 与 PI0.5
在开源机器人领域的一个重要里程碑中,我们将 Physical Intelligence 的 pi0 与 pi0.5 策略集成进了 LeRobot!这些 VLA (视觉-语言-动作) 模型在解决开放世界泛化问题上迈出了重要一步。那么,π0.5 的革命性体现在哪里?
- 开放世界泛化:能够适应完全陌生的环境与情境,在物理、语义与环境层面实现跨域泛化。
 - 异构数据共训练:从多模态网页数据、自然语言指令、子任务命令与多环境机器人数据的多样组合中学习。
 - Physical Intelligence 合作:特别感谢 Physical Intelligence 团队 的开创性工作!
 
你可以在 Hugging Face Hub 上找到这些模型:pi0.5_base、pi0_base 及它们的 Libero 微调版本。更多细节请参考 Physical Intelligence 的研究博客。
GR00T N1.5
另一项令人振奋的进展是,我们与 NVIDIA 机器人团队携手,将 GR00T N1.5 集成进 LeRobot!这是一款面向泛化的开源基础模型,能够进行跨本体的推理与技能迁移。它接收多模态输入 (如语言与图像) ,可在多样环境中执行复杂的操作任务,标志着通用机器人又一大步。GR00T N1.5 为何与众不同?
- 泛化推理与技能:作为跨本体的基础模型,GR00T N1.5 擅长泛化推理与操作任务,并提升了语言跟随能力。
 - 大规模异构训练:训练数据覆盖真实人形机器人采集数据、NVIDIA Isaac GR00T Blueprint 生成的合成数据,以及互联网规模的视频数据。
 - 与 NVIDIA 合作:我们很高兴与 NVIDIA 团队 合作,将这一前沿模型带给开源的 LeRobot 社区!
 
你可以在 Hugging Face Hub 上找到该模型:GR00T-N1.5-3B。更多信息请查看 NVIDIA 的研究页面 与 官方 GitHub 仓库。
这些策略在 lerobot 中的原生集成,让机器人学习更开放、更可复现。立即试用、分享你的训练运行结果,让我们共同推动具身智能的前沿!
机器人:插件系统引领硬件集成新纪元
对硬件爱好者而言的重磅消息!我们发布了全新的插件系统,彻底改造了第三方硬件与 LeRobot 的集成方式。现在,只需一次 pip install,就能连接任意机器人、相机或遥操作设备,无需修改核心库。
核心优势
- 可扩展性:在独立的 Python 包中开发并集成自定义硬件。
 - 规模化:支持不断增长的设备生态,而不会“增肥”核心库。
 - 社区友好:降低社区贡献门槛,促进更高效的协作。
 
想要创建自己的插件?请阅读我们的 文档。
pip install lerobot_teleoperator_my_awesome_teleop
lerobot-teleoperate --teleop.type=my_awesome_teleop
Reachy 2 集成
得益于全新插件系统,我们已将 Pollen Robotics 的 Reachy 2 集成到 LeRobot 中!Reachy 2 同时支持真实机器人控制与仿真,让你可以立即开展遥操作与自主演示实验。
手机集成
得益于强大的新 Pipeline 系统,你现在可以直接用手机 (iOS/Android) 遥操作你的从动机械臂。手机作为遥操作设备,RobotProcessor Pipeline 负责全部数据变换,让你轻松在不同动作空间 (如末端执行器空间) 驱动机器人。查看示例。
Hugging Face 机器人学习课程
我们上线了一门全面、可自学、且完全开源的课程,旨在让机器人学习真正“人人可学”!如果你对真实世界中的机器人如何学习感兴趣,这是绝佳的起点。
在这门课程中,你将学到:
- 理解经典机器人学的基础知识。
 - 使用生成式模型进行模仿学习 (VAE、扩散模型等) 。
 - 将强化学习应用于真实机器人。
 - 探索最新的通用机器人策略,如 PI0 与 SmolVLA。
 
加入 Hugging Face Robotics 组织 一起学习吧!
深入讲解:现代机器人学习教程
我们还发布了一篇动手实践的现代机器人学习教程,系统梳理近期的关键进展。该指南从第一性原理重新推导现代技术,并提供可直接运行的示例代码,全面基于 LeRobot 与 Hugging Face。
教程托管在一个 Space 中,包含大量基于 LeRobot 的实操示例,所有模型与数据集均在 Hugging Face Hub 上。同时你也可以查看 我们的论文 以获得更全面的概览。
团队总结
除了以上重大功能,这个版本还包含大量的错误修复、文档改进、依赖更新、更多示例与更好的基础设施,只为让你在使用 LeRobot 时获得更顺滑、更可靠的体验。
衷心感谢每一位社区成员的宝贵贡献、反馈与支持。我们对开源机器人的未来无比期待,也迫不及待地想与你一起构建下一步!
更多精彩,敬请期待  现在就从 这里 开始吧!
—— LeRobot 团队 ️
英文原文: https://huggingface.co/blog/lerobot-release-v040
原文作者: Steven Palma, Michel Aractingi, Pepijn Kooijmans, Caroline Pascal, Jade Choghari, Francesco Capuano, Adil Zouitine, Martino Russi, Thomas Wolf
译者: Luke, Hugging Face Fellow
LeRobot v0.4.0 正式发布:全面提升开源机器人的学习能力的更多相关文章
- 分布式云原生平台Kurator v0.2.0正式发布!一键构建分布式云原生平台
		
摘要:北京时间2023年2月9日,Kurator 正式发布 v0.2.0 版本. 本文分享自华为云社区<分布式云原生平台Kurator v0.2.0正式发布!一键构建分布式云原生平台>,作 ...
 - 开源社交系统ThinkSNS+ V0.8.0 正式发布(一期功能版本)
		
智士软件旗下开源sns社交系统ThinkSNS即将进入10周年,推出并行两代系统ThinkSNSV4和ThinkSNS+,以专业易用的技术源码输出,驱动互联网社交软件建设及创业,使用ThinkSNS改 ...
 - PDMan-2.1.0 正式发布:用心开源,免费的国产数据库建模工具    PowerDesigner
		
PDMan是一款开源免费的数据库模型建模工具,支持Windows,Mac,Linux等操作系统,是PowerDesigner之外,更好的免费的替代方案.他具有颜值高,使用简单的特点.包含数据库建模,灵 ...
 - Nacos 2.0 正式发布,性能提升 10 倍!!
		
3月20号,Nacos 2.0.0 正式发布了! Nacos 简介: 一个更易于构建云原生应用的动态服务发现.配置管理和服务管理平台. 通俗点讲,Nacos 就是一把微服务双刃剑:注册中心 + 配置中 ...
 - Nacos 2.0 正式发布,性能提升了 10 倍!!
		
前不久,在3月20号,Nacos 2.0.0 正式发布了!我简单看了下官方的介绍,可能nacos未来逐渐会成为各大公司作为服务治理和配置中心的主要中间件. Nacos 简介:一个更易于构建云原生应用的 ...
 - AppBox_v2.0完整版免费下载,暨AppBox_v3.0正式发布!
		
文章更新: AppBox v6.0中实现子页面和父页面的复杂交互 AppBox 是基于 FineUI 的通用权限管理框架,包括用户管理.职称管理.部门管理.角色管理.角色权限管理等模块. AppBox ...
 - Kurator v0.3.0版本发布
		
摘要:2023年4月8日,Kurator正式发布v0.3.0版本. 本文分享自华为云社区<华为云 Kurator v0.3.0 版本发布!集群舰队助力分布式云统一管理>,作者:云容器大未来 ...
 - Spring Boot 2.2.0 正式发布,支持 JDK 13!
		
Java技术栈 www.javastack.cn 优秀的Java技术公众号 推荐阅读: Spring Boot 2.2.0 正式发布了,可从 repo.spring.io 或是 Maven Centr ...
 - Seata 0.7.0 正式发布
		
Seata 是 阿里巴巴 开源的 分布式事务中间件,以 高效 并且对业务 0 侵入 的方式,解决 微服务 场景下面临的分布式事务问题.Seata 0.7.0 已正式发布,本次共合并59pr,主要包括: ...
 - TypeScript 2.0 正式发布
		
9 月 22 日,TypeScript 2.0 正式发布了. TypeScript 是微软开发的开源的编程语言,主要负责人是 C# 之父 Anders Hejlsberg. TypeScript 成功 ...
 
随机推荐
- 16年后微软的“古董”复活!开发者用C#重构经典VB6 IDE,网友:遗留的“屎山”代码有救了...
			
http://ide.vb6.pro/ 出品 | CSDN(ID:CSDNnews) C# 发展多年以来,很多程序员喜欢用它来编写各种工具类软件.近日,向来奉行「Talk is Cheap,Show ...
 - mysql日志文件开启及详解:General_log 和 Binlog
			
General_log 详解 1.介绍 开启 general log 将所有到达MySQL Server的SQL语句记录下来. 一般不会开启开功能,因为log的量会非常庞大.但个别情况下可能会临时的开 ...
 - 各版本操作系统对.NET支持情况(0505更新)
			
https://www.newlifex.com/tech/os_net 借助虚拟机和测试机,检测各版本操作系统对.NET的支持情况. 安装操作系统后,实测安装相应运行时并能够运行星尘代理为通过. 测 ...
 - ubuntu 下 GCC/G++ 的 include 搜索路径查看与设置
			
https://blog.csdn.net/quicmous/article/details/106790319 一.如何查看 include 搜索路径输入如下命令: > echo 'main( ...
 - 【渲染管线】UnityURP[渲染路径]底层源码解析
			
[从UnityURP开始探索游戏渲染]专栏-直达 SRP提供的核心功能与架构 可编程管线基础 RenderPipeline基类 通过继承该类并重写Render()方法,开发者可自定义渲染流程 ...
 - 创建localhost的storageclass
			
https://github.com/rancher/local-path-provisioner kubectl apply -f https://raw.githubusercontent.com ...
 - C# Avalonia 13- MoreDrawing - CustomPixelShader
			
目前Avalonia无法继承Effect类重写,因为构造函数是internal.我们重写一个GrayscaleImage实现灰化. GrayscaleImage类 public class Gray ...
 - Flutter多语言国际化:完整的i18n解决方案
			
Flutter多语言国际化:完整的i18n解决方案 本文基于BeeCount(蜜蜂记账)项目的实际开发经验,深入探讨如何在Flutter应用中实现完整.高效的国际化支持. 项目背景 BeeCount( ...
 - vivo X80的创新密码:满足细分市场极致需求,用超长板赢得高端用户
			
在汽车发明出来之前,人们只是想要一驾更快的马车.当汽车出现后,不仅带给人们从未有过的快捷,也开启了一个巨大的市场. 智能手机是中国创新力量的一个代表.但是不可否认,近几年这个行业也遇到了创新瓶颈,一代 ...
 - CMD 与 ENTRYPOINT 区别
			
CMD 命令演示 编写 Dockerfile [root@sail dockerfile]# vim Dockerfile-cmd-test [root@sail dockerfile]# cat D ...