OneFlow框架的设计目标是实现:一个使用多机多卡就像使用单机单卡一样容易的深度学习框架。

可以说,这是国内最早的深度学习框架之一,也是至今还活着的公司中开发支持力度最低的,也是最缺少技术支持、用户支持、资金支持的,就这样的产品至今还活着就不得不佩服清华校友的能力强大,毕竟是张钹院士的学生。

虽然说这个产品很不好用,但是感觉这也不算是一个泛泛之辈,因为这个框架的设计就和其他的框架不同,其他的框架都是原生支持单机,后期扩展支持分布式,这个框架确是设计之初就原生支持分布式,可以说是一边开发一边支持分布式,可以说是另类中的另类了。

Oneflow框架难以安装,难以运行

可能是这个公司的经济条件有限,因此这个框架只有通过公司官网下载安装或GitHub下载安装两种方式,既不支持conda也不支持pip,可以说是极难安装使用的,并且你需要手动配置相关环境,比如cuda和cudnn,不过万幸的是这个框架还提供docker镜像安装,不过这下载网速也是一言难尽。

官方给出的oneflow的应用场景:

可以这么理解,使用oneflow的场景必须是要进行训练,然后呢又必须是分布式场景,而且应该是中等水平的集群,比如这里给的400张显卡的情况,但是呢实际业务需要训练的量又是现有资源无法支撑的,并且短时间内无法扩展集群,可以说是虽然有400张显卡了,但是依旧不够用,并且业务要求这个计算必须在一定时间内完成,无法无限后延。而且还有一点,那就是模型要求必须简单,因为这个框架还不是很成熟,各种算子可能并不支持,所以只有常见的模型和算子才能很好运行。

综合具备上面的这些条件后,就可以考虑使用oneflow了,因为oneflow的分布式下的训练速度经过测试要比其他框架要快。不过,不得不说这个oneflow框架需要满足这些条件才适用,也确实有些强人所难了。你说这东西必须是实际业务的生产环境,还必须是大集群,而且对计算性能很敏感,并且模型要简单,这时候才适合用,按照这个要求估计也确实没有多少场景适合了,毕竟有这400张显卡的地方估计也不差再加100张卡,而且这种应用场合应该是业务比较固定的,那为啥不采用租个集群呢,搞不懂这个奇葩要求。

在我看来,这个框架要想走下去,就得丰富其功能,加入更多的算子,并且建立社区,增加支持的项目,并且对小集群的使用环境下也要具有明显的性能优势才可以。毕竟曾经的几十个深度学习框架最后也就剩下这几家还活着,如果真的搞不定,这个活了6、7年的框架也是难逃关门的厄运的,这里不得不说搞这东西真的需要有足够的资金支持的,不然为啥只有Google、Facebook、百度、华为这几个公司最后还这么坚挺呢。

或许,这个OneFlow适合成熟业务从pytorch转换过来进行训练。

相关:

如何评价最近一流科技开源的深度学习框架 OneFlow?

王慧文收购国产AI框架OneFlow,为中国版ChatGPT疯狂抢人抢基建

国产深度学习框架 OneFlow 是否靠谱?的更多相关文章

  1. 国产深度学习框架mindspore-1.3.0 gpu版本无法进行源码编译

    官网地址: https://www.mindspore.cn/install 所有依赖环境 进行sudo make install 安装,最终报错: 错误记录信息: cat     /tmp/mind ...

  2. 让AI简单且强大:深度学习引擎OneFlow技术实践

    本文内容节选自由msup主办的第七届TOP100summit,北京一流科技有限公司首席科学家袁进辉(老师木)分享的<让AI简单且强大:深度学习引擎OneFlow背后的技术实践>实录. 北京 ...

  3. Windows7系统安装TensorFlow深度学习框架全过程

    本来以为很好安装的一个东西,硬是从晚上九点搞到十二点,安装其实并不难,主要是目前网上的教程有很多方案完全不一样,有根据pip安装的,有根据docker安装的等等,看得我眼花缭乱,好不容易找到一个靠谱点 ...

  4. [深度学习大讲堂]从NNVM看2016年深度学习框架发展趋势

    本文为微信公众号[深度学习大讲堂]特约稿,转载请注明出处 虚拟框架杀入 从发现问题到解决问题 半年前的这时候,暑假,我在SIAT MMLAB实习. 看着同事一会儿跑Torch,一会儿跑MXNet,一会 ...

  5. [转]Caffe 深度学习框架上手教程

    Caffe 深度学习框架上手教程 机器学习Caffe caffe 原文地址:http://suanfazu.com/t/caffe/281   blink 15年1月 6   Caffe448是一个清 ...

  6. Caffe 深度学习框架介绍

    转自:http://suanfazu.com/t/caffe/281 Caffe是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的贾扬清,目前在Google工作. Caffe是 ...

  7. 推荐GitHub上10 个开源深度学习框架

    推荐GitHub上10 个开源深度学习框架   日前,Google 开源了 TensorFlow(GitHub),此举在深度学习领域影响巨大,因为 Google 在人工智能领域的研发成绩斐然,有着雄厚 ...

  8. 贾扬清分享_深度学习框架caffe

    Caffe是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的 贾扬清,目前在Google工作.本文是根据机器学习研究会组织的online分享的交流内容,简单的整理了一下. 目录 ...

  9. 深度学习框架Caffe的编译安装

    深度学习框架caffe特点,富有表达性.快速.模块化.下面介绍caffe如何在Ubuntu上编译安装. 1. 前提条件 安装依赖的软件包: CUDA 用来使用GPU模式计算. 建议使用 7.0 以上最 ...

  10. 深度学习框架-caffe安装-环境[Mac OSX 10.12]

    深度学习框架-caffe安装 [Mac OSX 10.12] [参考资源] 1.英文原文:(使用GPU) [http://hoondy.com/2015/04/03/how-to-install-ca ...

随机推荐

  1. NET9 提供HybridCache解决分布式缓存中存在的远程链接&序列化带来的性能问题

    下面是一个标准的IDistributedCache用例: public class SomeService(IDistributedCache cache) { public async Task&l ...

  2. ConvertLatOrLonFilter-经纬度格式转换-保留6位

    ConvertLatOrLonFilter-经纬度格式转换-保留6位 /** * 转换经纬度 * 小数点最后最多为6位 * @param latOrLon * @return */ private S ...

  3. mybatis insert foreach批量添加

    mybatis insert foreach批量添加 int insertSelectiveBatch(List<ImageDetailEntity> myList); //写法1 < ...

  4. 向Web服务器端上传文件

    server.py import flaskapp = flask.Flask(__name__)@app.route('/upload', methods=['POST'])def uploadFi ...

  5. Navicat 连接SQL Server LocalDB的方法

    截止2021年11月,Sql Server LocalDB的资料网上并不多见,出来了其实也有一段年头了. SqlServerManagerStudio自带的工具进行查询使用体验并不好,Navicat是 ...

  6. Playbook条件语句

    目录 Playbook条件语句 1. when的基本使用 1.1 when的基本示例 1.2比较运算符 1.3 比较运算符示例 1.4 逻辑运算符 1.5 逻辑运算符示例 2. 条件判断与block ...

  7. Nuxt3 的生命周期和钩子函数(三)

    title: Nuxt3 的生命周期和钩子函数(三) date: 2024/6/27 updated: 2024/6/27 author: cmdragon excerpt: 摘要:概述了Nuxt3的 ...

  8. Linux内核中的各种文件系统:proc、tmpfs、devfs、sysfs

    Linux内核中的各种文件系统:proc.tmpfs.devfs.sysfs 背景 刚学完proc文件系统在内核驱动 中的使用,就看到另外的sysfs的有关接口.很好奇proc文件系统和sysfs文件 ...

  9. Linux设备模型:3、Uevent

    作者:wowo 发布于:2014-3-10 20:39 分类:统一设备模型 http://www.wowotech.net/device_model/uevent.html Uevent Uevent ...

  10. 配置hive环境步骤(zookeeper高可用集群已搭建)

    安装mysql:1. 检查当前环境是否安装mysql服务(命令:rpm -qa | grep -i mysql)2. 卸载自带的mysql3. 卸载软件:rpm -e --nodeps mysql-l ...