OneFlow框架的设计目标是实现:一个使用多机多卡就像使用单机单卡一样容易的深度学习框架。

可以说,这是国内最早的深度学习框架之一,也是至今还活着的公司中开发支持力度最低的,也是最缺少技术支持、用户支持、资金支持的,就这样的产品至今还活着就不得不佩服清华校友的能力强大,毕竟是张钹院士的学生。

虽然说这个产品很不好用,但是感觉这也不算是一个泛泛之辈,因为这个框架的设计就和其他的框架不同,其他的框架都是原生支持单机,后期扩展支持分布式,这个框架确是设计之初就原生支持分布式,可以说是一边开发一边支持分布式,可以说是另类中的另类了。

Oneflow框架难以安装,难以运行

可能是这个公司的经济条件有限,因此这个框架只有通过公司官网下载安装或GitHub下载安装两种方式,既不支持conda也不支持pip,可以说是极难安装使用的,并且你需要手动配置相关环境,比如cuda和cudnn,不过万幸的是这个框架还提供docker镜像安装,不过这下载网速也是一言难尽。

官方给出的oneflow的应用场景:

可以这么理解,使用oneflow的场景必须是要进行训练,然后呢又必须是分布式场景,而且应该是中等水平的集群,比如这里给的400张显卡的情况,但是呢实际业务需要训练的量又是现有资源无法支撑的,并且短时间内无法扩展集群,可以说是虽然有400张显卡了,但是依旧不够用,并且业务要求这个计算必须在一定时间内完成,无法无限后延。而且还有一点,那就是模型要求必须简单,因为这个框架还不是很成熟,各种算子可能并不支持,所以只有常见的模型和算子才能很好运行。

综合具备上面的这些条件后,就可以考虑使用oneflow了,因为oneflow的分布式下的训练速度经过测试要比其他框架要快。不过,不得不说这个oneflow框架需要满足这些条件才适用,也确实有些强人所难了。你说这东西必须是实际业务的生产环境,还必须是大集群,而且对计算性能很敏感,并且模型要简单,这时候才适合用,按照这个要求估计也确实没有多少场景适合了,毕竟有这400张显卡的地方估计也不差再加100张卡,而且这种应用场合应该是业务比较固定的,那为啥不采用租个集群呢,搞不懂这个奇葩要求。

在我看来,这个框架要想走下去,就得丰富其功能,加入更多的算子,并且建立社区,增加支持的项目,并且对小集群的使用环境下也要具有明显的性能优势才可以。毕竟曾经的几十个深度学习框架最后也就剩下这几家还活着,如果真的搞不定,这个活了6、7年的框架也是难逃关门的厄运的,这里不得不说搞这东西真的需要有足够的资金支持的,不然为啥只有Google、Facebook、百度、华为这几个公司最后还这么坚挺呢。

或许,这个OneFlow适合成熟业务从pytorch转换过来进行训练。

相关:

如何评价最近一流科技开源的深度学习框架 OneFlow?

王慧文收购国产AI框架OneFlow,为中国版ChatGPT疯狂抢人抢基建

国产深度学习框架 OneFlow 是否靠谱?的更多相关文章

  1. 国产深度学习框架mindspore-1.3.0 gpu版本无法进行源码编译

    官网地址: https://www.mindspore.cn/install 所有依赖环境 进行sudo make install 安装,最终报错: 错误记录信息: cat     /tmp/mind ...

  2. 让AI简单且强大:深度学习引擎OneFlow技术实践

    本文内容节选自由msup主办的第七届TOP100summit,北京一流科技有限公司首席科学家袁进辉(老师木)分享的<让AI简单且强大:深度学习引擎OneFlow背后的技术实践>实录. 北京 ...

  3. Windows7系统安装TensorFlow深度学习框架全过程

    本来以为很好安装的一个东西,硬是从晚上九点搞到十二点,安装其实并不难,主要是目前网上的教程有很多方案完全不一样,有根据pip安装的,有根据docker安装的等等,看得我眼花缭乱,好不容易找到一个靠谱点 ...

  4. [深度学习大讲堂]从NNVM看2016年深度学习框架发展趋势

    本文为微信公众号[深度学习大讲堂]特约稿,转载请注明出处 虚拟框架杀入 从发现问题到解决问题 半年前的这时候,暑假,我在SIAT MMLAB实习. 看着同事一会儿跑Torch,一会儿跑MXNet,一会 ...

  5. [转]Caffe 深度学习框架上手教程

    Caffe 深度学习框架上手教程 机器学习Caffe caffe 原文地址:http://suanfazu.com/t/caffe/281   blink 15年1月 6   Caffe448是一个清 ...

  6. Caffe 深度学习框架介绍

    转自:http://suanfazu.com/t/caffe/281 Caffe是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的贾扬清,目前在Google工作. Caffe是 ...

  7. 推荐GitHub上10 个开源深度学习框架

    推荐GitHub上10 个开源深度学习框架   日前,Google 开源了 TensorFlow(GitHub),此举在深度学习领域影响巨大,因为 Google 在人工智能领域的研发成绩斐然,有着雄厚 ...

  8. 贾扬清分享_深度学习框架caffe

    Caffe是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的 贾扬清,目前在Google工作.本文是根据机器学习研究会组织的online分享的交流内容,简单的整理了一下. 目录 ...

  9. 深度学习框架Caffe的编译安装

    深度学习框架caffe特点,富有表达性.快速.模块化.下面介绍caffe如何在Ubuntu上编译安装. 1. 前提条件 安装依赖的软件包: CUDA 用来使用GPU模式计算. 建议使用 7.0 以上最 ...

  10. 深度学习框架-caffe安装-环境[Mac OSX 10.12]

    深度学习框架-caffe安装 [Mac OSX 10.12] [参考资源] 1.英文原文:(使用GPU) [http://hoondy.com/2015/04/03/how-to-install-ca ...

随机推荐

  1. 连续段 dp - 状态转移时依赖相邻元素的序列计数问题

    引入 在一类序列计数问题中,状态转移的过程可能与相邻的已插入元素的具体信息相关. 这类问题通常的特点是,如果只考虑在序列的一侧插入,问题将容易解决. 枚举插入顺序的复杂度通常难以接受,转移时枚举插入位 ...

  2. C#.NET与JAVA互通之AES加密解密V2024

    C#.NET与JAVA互通之AES加密解密V2024 视频: 注意点: 1. KEY 和 IV 从字符串转byte数组时,双方要约定好编码,一般是UTF8. 2.明文从字符串转byte数组时,双方要约 ...

  3. 微信支付(付款码支付,条码支付,刷卡支付)左上角LOGO显示

    微信支付(付款码支付,条码支付,刷卡支付)左上角LOGO显示 如果你上送的sub_appid 公众号(小程序),优先显示你公众号(小程序)的LOGO,如果你的公众号(小程序)未设置LOGO,会显示上游 ...

  4. Kubernetes OOM 和 CPU Throttling 问题

    介绍 使用 Kubernetes 时,内存不足(OOM)错误和 CPU 限制(Throttling)是云应用程序中资源处理的主要难题.为什么呢? 云应用程序中的 CPU 和内存要求变得越来越重要,因为 ...

  5. 在线RSA公钥私钥生成工具

    在线RSA非对称加密公钥私钥生成工具,提供便捷.安全的公私钥生成服务.支持多种密钥长度选择,满足个性化需求.一键生成PEM格式证书,让您快速实现数据加密与身份验证,保障数据安全,提升网络安全防护能力. ...

  6. iOS从UI内存地址到读取成员变量(oc/swift)

    开发调试时,我们发现bug时常首先是从UI显示发现异常,下一步才会去定位UI相关连的数据的.XCode有给我们提供一系列debug工具,但是很多人可能还没有形成一套稳定的调试流程,因此本文尝试解决这个 ...

  7. Shell脚本实现Linux回收站

    前言 到目前为止,非图形化的Linux还没有回收站的命令. 那么,我们如果不小心将某一个文件删掉了,那就只能数据恢复了.如果这也不行,那就等着哭吧. 最新代码在我的github:https://git ...

  8. kong网关部署

    软件版本: Postgresql:9.6 (不使用最新版,是因为 konga 不支持) Kong:3.4.2 konga:0.14.7 (UI管理界面) ### Postgresql部署 ## doc ...

  9. 【论文阅读】Exploring the Limitations of Behavior Cloning for Autonomous Driving

    Column: January 16, 2022 11:11 PM Last edited time: January 21, 2022 12:23 PM Sensor/组织: 1 RGB Statu ...

  10. AIGC的行业发展

    1. AIGC的行业发展 AIGC(Artificial Intelligence Generated Content,人工智能生成内容)是利用人工智能技术来自动生成内容的一种新型内容创作方式.它基于 ...