人形机器人｜星动纪元开源端到端强化学习训练框架“Humanoid-Gym”，实现「sim-to-real」功能

开源的 Humanoid-Gym 框架，主要实现的技术有：

通过精心设计的奖励函数；
域随机化技术；

该开源项目实现 sim-to-real 的功能，实现了强化学习训练从模拟环境向真实世界迁移（即 sim-to-real transfer）的问题克服。

目前，该框架已在星动纪元旗下的两款机器人——小星（1.2米高）和小星max（1.65米高）上成功验证。

Github 代码库: https://github.com/roboterax/humanoid-gym

同时该项目还给出了一个新的验证的方式，那就是先用计算效率比较高端NVIDIA ISAAC仿真环境做训练，获得一个初步的模型，然后在将这个模型放到计算效率较差但精度高的 mujoco 环境下做调整训练（相当于微调），然后再用在mujoco环境下调整后的模型放到真实环境下采集数据并进行最后的校准操作，从而实现sim2real的目的。

可以看到该项目中的这个sim2sim的操作其实少见，不过对于这个操作的有效性还需验证，不过这个idea还是蛮新奇的。

星动纪元表示，除了用sim-to-real 验证以外，另一个常见的做法是用第二个更高精度的仿真环境来做初步做验证（sim-to-sim）。本次Humanoid-Gym开源后，用户可以通过该框架轻松运用sim-to-sim转换功能，先在更高精度的仿真环境Mujoco中进行初步验证与筛选，从而提升sim-to-real转换的效率和成功率。

除此之外，该开源项目还引入了若干评估指标，用以衡量训练策略的效果，包括但不限于速度追踪、动作丝滑程度等。

人形机器人｜星动纪元开源端到端强化学习训练框架“Humanoid-Gym”，实现「sim-to-real」功能的更多相关文章

最强 NLP 预训练模型库 PyTorch-Transformers 正式开源：支持 6 个预训练框架，27 个预训练模型
先上开源地址: https://github.com/huggingface/pytorch-transformers#quick-tour 官网: https://huggingface.co/py ...
如何使用自对弈强化学习训练一个五子棋机器人Alpha Gobang Zero
前言 2016年3月,Alpha Go 与围棋世界冠军.职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜,在当时引起了轩然大波.2017年10月,谷歌公布了新版五子棋程序 AlphaGo Ze ...
谷歌重磅开源强化学习框架Dopamine吊打OpenAI
谷歌重磅开源强化学习框架Dopamine吊打OpenAI 近日OpenAI在Dota 2上的表现,让强化学习又火了一把,但是 OpenAI 的强化学习训练环境 OpenAI Gym 却屡遭抱怨,比如不 ...
Salesforce开源TransmogrifAI：用于结构化数据的端到端AutoML库
AutoML 即通过自动化的机器学习实现人工智能模型的快速构建,它可以简化机器学习流程,方便更多人利用人工智能技术.近日,软件行业巨头 Salesforce 开源了其 AutoML 库 Transmo ...
【转载】QQ炫舞手游自制谱子教程（星动模式）
第一步:计算ET和BPM: 抄送原作者部落链接:https://buluo.qq.com/p/detail.html?bid=368006&pid=981862-1529828677& ...
Swift3.0服务端开发(一) 完整示例概述及Perfect环境搭建与配置（服务端+iOS端）
本篇博客算是一个开头,接下来会持续更新使用Swift3.0开发服务端相关的博客.当然,我们使用目前使用Swift开发服务端较为成熟的框架Perfect来实现.Perfect框架是加拿大一个创业团队开发 ...
详解APM数据采样与端到端
高驰涛云智慧首席架构师据云智慧统计,APM从客户端采集的性能数据可能占到业务数据的50%,而企业要做到从Request到Response整个链路中涉及到的所有数据的准确采集,并进行有效串接,进而实 ...
基于tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)
基于tensorflow的‘端到端’的字符型验证码识别 1 Abstract 验证码(CAPTCHA)的诞生本身是为了自动区分自然人和机器人的一套公开方法, 但是近几年的人工智能技术的发展 ...
端到端测试工具--testcafe
写在前面随着业务的增加,复杂性的增加,我们更需要保证页面不能出错,之前需要每次上线之前需要每次人工测试,如果有好多改动,为保证业务不出错,需要耗费更多的时间来测试,所以我们需要写一些测试来保证业务的 ...
基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)
基于python语言的tensorflow的‘端到端’的字符型验证码识别 1 Abstract 验证码(CAPTCHA)的诞生本身是为了自动区分自然人和机器人的一套公开方法, 但是近几年的 ...

随机推荐

OpenCV简单实现AR需用到的算法函数介绍
目前的AR需求(想要达到的目标) 公司目前的需求是要能够指定一个物体开始追踪,将一张预先准备好的图像覆盖在被追踪的物体上, 然后镜头偏转缩放各类操作,再转回来仍然可以识别到,并且同样依旧覆盖图片到先前 ...
Ubuntu安装VMware tools后不起作用
复制和立即适应客户机不起作用. 解决: 1)不需要卸载 2)命令行执行sudo apt-get install open-vm-tools-desktop 3)可能会提示apt-get update或 ...
C++之printf函数
背景 C++中可以使用cout来输出. 但是cout输出一些格式化的数据非常麻烦. 比如: hour,min和sec代表当前时间,需求:按12:00:00格式输出当前时间. //使用cout输出 co ...
markdown折叠展开代码
背景有的时候,我们的代码太多,直接用cout<<"hello";很不方便. 我们可以将代码折叠. 效果代码普通代码折叠 <details> <s ...
vim中ctags 的使用
--- title: vim中ctags 的使用 EntryName: vim-config-with-ctags date: 2020-08-19 11:17:38 categories: tags ...
【基础整理】Mapping representation 机器人所用地图种类及相关介绍
参考与前言本文主要介绍建图 Mapping 方面的一些基础知识介绍与相关下游任务使用涉及知识较为基础,SLAM大佬们可以提前退出了主要针对应用为移动机器人与物流无人驾驶车:提前申明:大部分文 ...
如何用python计算不定积分
在Python中,计算不定积分(即原函数或反导数)可以通过SymPy库实现.SymPy是一个用于符号数学的Python库,支持许多类型的数学对象,包括整数.有理数.实数.复数.函数.极限.积分.微分. ...
Linux服务器从头配置
安装配置jdk 下载 jdk jdk-8u171-linux-x64.tar.gz 将该压缩包放到/usr/local/jdk目录下然后解压(jdk目录需要自己手动创建) tar zxvf jdk-8 ...
Vue 框架怎么实现对象和数组的监听？
如果被问到 Vue 怎么实现数据双向绑定,大家肯定都会回答通过 Object.defineProperty() 对数据进行劫持,但是 Object.defineProperty() 只能对属性进行数 ...
网易数帆开源贡献获业界肯定，轻舟API网关获OSCAR尖峰开源技术创新奖
2020年10月16日,由中国信息通信研究院主办的"2020开源产业大会"在北京线下与线上同步召开,主办方在会上公布了"OSCAR尖峰开源奖项"各个奖项的评选结 ...

人形机器人｜星动纪元开源端到端强化学习训练框架“Humanoid-Gym”，实现「sim-to-real」 功能

人形机器人｜星动纪元开源端到端强化学习训练框架“Humanoid-Gym”，实现「sim-to-real」 功能的更多相关文章

随机推荐

热门专题

人形机器人｜星动纪元开源端到端强化学习训练框架“Humanoid-Gym”，实现「sim-to-real」功能

人形机器人｜星动纪元开源端到端强化学习训练框架“Humanoid-Gym”，实现「sim-to-real」功能的更多相关文章