【转载】逐际动力双足机器人P1在深圳塘朗山零样本、无保护、全开放完成测试

原文：

【逐际动力双足机器人P1在深圳塘朗山零样本、无保护、全开放完成测试】

上周，就在全球AI界被美国初创公司Figure联合OpenAI发布的首款人形机器人Figure 01相关视频而震撼的时候，中国深圳的“逐际动力双足机器人P1”早已低调地完成了塘朗山郊野大挑战。

3月12日，基于强化学习（Reinforcement Learning，RL），“逐际动力双足机器人P1”第一次来到位于深圳的郊野公园塘朗山，零样本、无保护、全开放进行测试，开箱即跑，在完全陌生的野外环境中，高动态完成了在多种复杂地形上的移动，表现出强化学习训练后，优异的控制力和稳定性。

P1是逐际动力在中国率先推出的一款新颖的双足机器人，也是逐际动力强化学习系统化研发与模块化测试的重要平台，用于推进双足基础运动能力的研发和迭代。P1成功征服野外森林，正是逐际动力强化学习系统化。

逐际动力在强化学习有着长期的积累，目前聚焦把强化学习的前沿技术转化为系统化研发能力，支持产品功能开发，并提出了自己的强化学习研发体系，主要包括Real2Sim2Real闭环、神经网络架构设计、数据生成机制与训练算法设计等三大核心版块，搭配不断完善的流程管理和算法验证，推动人形机器人重要功能的开发。

P1是逐际动力在中国率先推出的一款新颖的双足机器人，也是逐际动力强化学习系统化研发与模块化测试的重要平台，用于推进双足基础运动能力的研发和迭代。P1成功征服野外森林，正是逐际动力强化学习系统化研发的成果，也是三大核心板块能力的体现。

Real2Sim2Real闭环，从Real2Sim到Sim2Real，打通数据到数据的自动闭环，不管是采集物理世界数据生成仿真模型，还是把仿真后的策略部署到硬件上，从数据的生成、迁移到部署，逐际动力的目标是实现全过程自动化，最大限度降低人工干预，缩小仿真和现实之间的差距，提高训练的效率和质量。

神经网络架构设计，神经网络并不是一个黑盒，而是一个科学的系统化复杂结构，决定了强化学习能力的上限，其架构的设计体现了不同团队的特点和实力。逐际动力的神经网络由不同模块组成，如何划分模块、如何定义每个模块、每个模块输入输出的界面是什么，这些设计至关重要。逐际动力打造的神经网络架构能够有效应对环境交互和硬件差异带来的巨大干扰，生成具有自适应性的控制策略，实现同一个神经网络适用于不同的机器人和场景。

数据生成机制与训练算法设计，在强化学习中，数据是训练的关键，但不是数据规模越大，训练效果就一定越好。逐际动力把重点锁定在解决有效数据稀缺的问题上，提出迭代式预训练（Iterative Pre-training）方法，把通用机器人的基础运动能力划分为不同级别，进行循序渐进的预训练，这个过程让训练的结果更可控，从而高效地产出和收集有效数据，训练出高性能的策略（Policy）。

在这次测试中，我们看到野外和实验室、城市的最大区别是，没有一个台阶或者斜坡，甚至平地是一样的；从山脚到山顶，沿途的地貌截然不同，水土流失导致地下岩石裸露，斜坡上长满缠绕的藤蔓，土层风化变成泥沙覆盖地面，就地取材搭成的沟渠奇形怪状，这些都是P1从未经历过的场景，对于普通人来说也不是轻而易举就能克服。

在仿真训练过程中，P1没有被输入过任何与森林、徒步相关的数据，与落地环境差异巨大，但依然能够适应全新的环境，在变化莫测的森林中自如行走。这得益于逐际动力系统化的强化学习训练，保证研发成果在实际应用中可行、可用、可靠。

【转载】逐际动力双足机器人P1在深圳塘朗山零样本、无保护、全开放完成测试的更多相关文章

双足步行机器人的ZMP与CoP检测
静态步行与动态步行机器人步态分为静态步行和动态步行.当机器人做静态步行运动时,身体的各个部分运动速度很小,机器人的整体稳定性较易控制.静态步行稳定性采用机器人的重心地面投影点(Center of G ...
【51Nod1386】双马尾机器人Description 解题报告
[51Nod1386]双马尾机器人Description 给定\(n\)和\(k\),我们要在\(1,2,3,...,n\)中选择若干的数,每一种选择的方案被称为选数方案. 我们定义一种选数方 ...
【零基础】斯坦福四足机器人DIY指引
可以后空翻的机器狗近日斯坦福开源了一个四足机器人项目“Stanford Doggo”,“只需”3000美金就可以DIY一个能跳一米高兼后空翻的电子小狗,一段时间研究后我们写了这篇简单的指引帮助大家快 ...
树莓派（香橙派）通过.NET IoT 操作SPI编写屏幕驱动顺手做个四足机器人（一）
摘要这片文章主要是记录自己的整活过程,涉及到的技术包括.NET IoT, .NET Web, .NET MAUI,框架采用的也是最新的.NET 7. 本人是用的树莓派Zero 2 W(ubuntu- ...
[转载]队列queue和双端Dequeue
转载自:http://uule.iteye.com/blog/2095650?utm_source=tuicool 注意:这都只是接口而已 1.Queue API 在java5中新增加了java.ut ...
【转载】ANSYS 动力分析 (9) - 瞬态动力分析 (1)
原文地址:http://htbbzzg.blog.163.com/blog/static/69725206201081663611208/ 第四章瞬态动力分析第一节:瞬态动力分析的定义和目的 ...
[转载]Eziriz .NET Reactor 4.7.0.0 官方原版+破解补丁（强大的代码保护和软件防盗版工具）
Eziriz .NET Reactor 是一个强大的代码保护和软件防盗版工具,完全由.NET框架编写..NET Reactor支持NET平台的软件许可系统,并支持NET程序集所有语言.当.Net编译器 ...
12只超酷机器人，在家用3D打印搞定！
3D打印最吸引人的地方在于它完全无极限!现在的3D打印已经广范应用在我们的生活.以及工业上的各个领域.最棒的是,DIY玩家可以真正从中受益.我们现在已经可以应用3D打印,在家制作自己的机器人了.如果你 ...
PWM波控制舵机总结
文章转自:http://www.geek-workshop.com/thread-70-1-1.html 一.关于舵机: 舵机(英文叫Servo):它由直流电机.减速齿轮组.传感器和控制电路组成的一套 ...
Christopher G. Atkeson 简介
有一个事实:双足机器人的稳定性问题单靠算法是搞不定的!!! 在2015 DARPA 机器人挑战赛中,许多参赛团队的机器人使用了Atlas,他们通过安装他们自己的软件并修改来让机器人保持平衡.来自WPI ...

随机推荐

解决：Maven PKIX path building failed: sun.security.provider.certpath
在构建SpringBoot项目时,maven下载依赖会报 PKIX path building failed: sun.security.provider.certpath的错误. 使用https:/ ...
编程语言界的丐帮 C#.NET 国密数字信封民生银行
民生银行的库DLL只有C版本和JAVA版本.按着JAVA版本做的C# 实现. 重点内容. 1.数字信封就是 CmsEnvelopedData Der编码后转BASE64 2.重点类:ContentIn ...
限速上传文件到腾讯对象存储cos的脚本
官网:https://cloud.tencent.com/document/product/436/12269 安装包,这里用的python2.7 # pip install -U cos-pytho ...
idea编译报错静态Map初始化报错java.lang.ExceptionInInitializerError
idea编译报错静态Map初始化报错java.lang.ExceptionInInitializerError package cc.mrbird.utils; import java.util.H ...
Navicat 连接SQL Server LocalDB的方法
截止2021年11月,Sql Server LocalDB的资料网上并不多见,出来了其实也有一段年头了. SqlServerManagerStudio自带的工具进行查询使用体验并不好,Navicat是 ...
聊一聊 Monitor.Wait 和 Pluse 的底层玩法
一:背景 1. 讲故事在dump分析的过程中经常会看到很多线程卡在Monitor.Wait方法上,曾经也有不少人问我为什么用 !syncblk 看不到 Monitor.Wait 上的锁信息,刚好昨天 ...
《史记 XuYu列传》
前言甲辰年二月十九,余记挂友人须臾.大醉,作此篇以悼念故友.忆往昔同窗之情,言语无不有经天纬地之能,举手投足间便可斩敌方上将.能文能武,乃当世之奇才,其言语中有大智慧.(文体并不重要) 吃饭时 Xu ...
InvalidOperationException Cannot modify ServiceCollection after application is built .Net6 异常
背景我用了一个叫Unchase.Swashbuckle.AspNetCore.Extensions的库来加强Swagger的文档,我一般写法是这样的: builder.Services.AddSwa ...
python 动态导入模块并结合反射，动态获取类、方法（反射太好用），动态执行方法
背景: 关键字驱动框架,不同的关键字方法分别定义在不同的类,真正执行关键字方法又在不同的类(简称A),这样就需要在执行前,要在文件A下import要使用的模块,如果有很多页面操作或很多模块时,就需要每 ...
苹果应用商店上传应用卡在了“Authenticating with the iTunes Store”
在终端中依次运行下面代码 cd ~ mv .itmstransporter/ .old_itmstransporter/ "/Applications/Xcode.app/Contents/ ...

【转载】逐际动力双足机器人P1在深圳塘朗山零样本、无保护、全开放完成测试

【转载】逐际动力双足机器人P1在深圳塘朗山零样本、无保护、全开放完成测试的更多相关文章

随机推荐

热门专题