本文纯属闲谈(吐槽)

国外搞深度学习弄出了TensorFlow(编译型)以后推到工业界和学术界,但是由于其不好用(太过于复杂),同一时间另一个框架pytorch(非编译型)。由于pytorch是非编译型的框架,所以可以和python紧密结合,更加pythonic,但是性能与TensorFlow有较大差距,并且不原生支持工业界使用,但是由于其好用(学习时间估计是TensorFlow的十分之一),因此慢慢的pytorch使用的人就多了起来,本来pytorch是作为一个实验型产品的,没想到这么多人用,然后Facebook发现这个是好苗子,于是加大投入,在性能上和工业级支持上追赶Tensorflow,最后在和TensorFlow相差不大的情况下完全淘汰了TensorFlow(估计也就Google自己在用,毕竟Google自己家有TPU)。

可以说,虽然美国当年有两个深度学习框架在竞争,但是毕竟是属于两个设计思路,并且是领域刚兴起的时候,谁也不知道那条路可行,因此也就出现了二者竞争的局面。但是现在再看看国内的深度学习框架,简直是琳琅满目,但凡有些积累的AI公司都要搞自己公司的AI计算框架,弄的最后国产的深度学习框架已经几倍于美国的数量了,但是这事是一件好事嘛,我并不这么看。要知道深度学习框架,国内的设计基本是在学TensorFlow和pytorch的,当然现在还有一个Jax,可以说国内的各厂家的深度学习框架基本属于同质化竞争。其实深度学习框架并没有大家想象的那么难做,就像国产的Linux系统一样,一个中小型的公司就完全可以在一两年的时间内手搓一个出来。深度学习框架也是如此,如果使用NVIDIA的GPU,底层库都是美国做好的,你在上层做好调用,弄好自动微分的前向和后向模式,在把基本的CNN、RNN、Attention等kernel函数包装一下,这个深度学习框架也就出来了,这也是为啥和TensorFlow、pytorch同一时间出现的众多美国的开源深度学习框架一样,如果你的编程能力比较OK,你甚至可以手搓一个toy版本的深度学习框架。

其实,重点并不在于深度学习框架具体用哪种方式实现,而是在于如何能使其运算性能更高,更稳定,更易用,有更多的社区用户支持,背后的企业是否能有足够的投资进行维护和升级。国内搞出这么多深度学习框架,就和高校科研所发论文一样,就是为了发而发,就和申请基金和专利一样,你也不要管它好用不好用,反正报上去就能算业绩,来年好评正高级。如果企业也这么高,我想着不是百家争鸣,而是内耗。这么多企业把资金和精力都投入到相同的工作上,最后估计就看哪家企业先放弃。各家AI企业应该搞差异化的工作,而不是搞同质化的工作,就比如搞大语言模型,全国各家AI企业也都是一家搞一个,结果搞出了几百个大模型,我就在想,最后有几个人会使用这几百个大语言模型,又有几个人会去使用国内那么多的深度学习框架。不要忘记,国内的这几百个大语言模型都没有赶上openai的那一个好用,国内的那些数不尽的深度学习框架最后在GitHub上可以看到的项目最终还是pytorch和TensorFlow的。

国产AI发展的内耗我想是短时间内难以终结的,我想最终就要看谁真的能强起来,把其他家都甩在后面,这样其他的企业估计就放弃搞这些同质化的开发了。这就和中国古代的春秋战国一样,最后只有一家实力远超其他家,这个局面才会统一。

PS. 国产的那些深度学习框架,我只用过mindspore,因为只有他家有能力设计芯片并制作芯片(国内代工),而且也只有这家有足够的经济基础,虽然这家是搞销售起家后来以硬件设计著称的,但是这种内卷竞赛玩到最后就是看谁有钱,谁能挺得住,所以我押宝就压这个mindspore了,至于其他国产深度学习框架,那是真的没精力去了解了,太多了,我就用个CNN和RNN,搞出这么多框架,太吓人了,毕竟这个深度学习框架和大语言模型说的再多其本质也无非只是工具,既然手头上有一个好用的锤子了为啥还要研究出那么多长相不同的锤子了,毕竟这东西是用来使用的,而不是用来申请专利的(内涵一下,哈哈哈),不是多多益善,而是好用就够。

国产AI发展是百家争鸣还是疯狂内卷(内耗)?的更多相关文章

  1. 贾扬清谈大数据&AI发展的新挑战和新机遇

    摘要:2019云栖大会大数据&AI专场,阿里巴巴高级研究员贾扬清为我们带来<大数据AI发展的新机遇和新挑战>的分享.本文主要从人工智能的概念开始讲起,谈及了深度学习的发展和模型训练 ...

  2. 从HashMap面试聊聊互联网内卷

    微信公众号:大黄奔跑 关注我,可了解更多有趣的面试相关问题. 写在之前 毫无疑问,回想2020年有什么词出现在眼前最多的,无疑是"996"和"内卷",从马老师的 ...

  3. 职场「OKR」,魔幻又内卷

    个人习惯称之为[O-KR-KPI]组合: 01 从进厂实习那天开始,就接触了KPI的概念: 互联网公司,年初入职,可能因为那天是周五,又赶上月底,少不了要把KPI搬出来折腾一番: 天时,地利,人和: ...

  4. involution 内卷化

    involution 内卷化 虽然不熟悉 involution,但是我想起另外两个常用词:evolution(进化)和 revolution(革命). 它们共同的词根volute,拉丁语原意是&quo ...

  5. 不权威的国产CPU发展历程

    最近进行了一些国产化相关工作 趁着周末有时间,自己整理一下这段时间的学习内容. 毕竟不是处理器和芯片的业内人士,里面多有纰漏,请谅解. 希望可以作为入门学习的简单知识. 1.0 远古时代 unix 世 ...

  6. 如何看待Android开发的“前景和内卷”

    我们首先来意淫一波 5G时代Android即将崛起,Android将与物联网强强联合,配合上5G信息高速传递的模式,再搭配物联网号召的"万物互通"的旗号,同时各位Android开发 ...

  7. 帮助IT业告别内卷,哪项变革最能被寄予厚望?

    近日,中国软件行业协会发布<2021年中国低代码/无代码市场研究报告>,其中提到:我国低代码整体市场规模已达数十亿规模,并将在未来五年保持49.5%的复合增长率.低代码成为整个中国ICT产 ...

  8. [开源内卷] .NET 定时任务 -- FreeScheduler 支持 cron、持久化、可变定时设置

    前言 卷了,卷了,卷了,最近太卷...这篇文章写了好几天了,由于同类型文章太多,排期到今天发布.实在不想卷,得罪了!各位定时任务开源大佬们! .NET 定时组件生态实在太强大了,写下此文只希望能供大家 ...

  9. 作为一名双非本科毕业的Java程序员,我该如何在日益严重的内卷化中避免被裁?

    前言 对一个 Java 程序员而言,并发编程能否熟练掌握是判断他是不是优秀的重要标准之一.因为并发编程在 Java 语言中最为晦涩的知识点,它涉及内存.CPU.操作系统.编程语言等多方面的基础能力,更 ...

  10. Excel用户如何打破内卷?只需要一个新软件,就能突破excel天花板

    还在死磕Excel吗?到底值不值得? 你看看,现在有多少excel培训班和培训课?网上各种EXCEL使用技巧教程也是满天飞.很多人为了提升Excel技能,不遗余力学习各种函数用法.VBA用法等等,最近 ...

随机推荐

  1. 关于excel表

    对excel表的操作主要通过xlwt,xlrd模块. 创建excel表 import xlwtworkbook = xlwt.Workbook(encoding='utf-8') worksheet ...

  2. MySql 中 select 使用

    MySql select 多种查询方式 前言 在数据库使用过程中,使用最多的场景就是查询数据,所以今天我们总结一下常用用的查询 简单查询 带条件查询 多条件查询 输出指定字段查询 分组查询 查询结果排 ...

  3. Filter过滤器进行统一参数处理demo

    Filter过滤器进行统一参数处理demo import org.slf4j.Logger; import org.slf4j.LoggerFactory; import javax.servlet. ...

  4. 中国电信登录RSA算法+分析图文

    Tips:当你看到这个提示的时候,说明当前的文章是由原emlog博客系统搬迁至此的,文章发布时间已过于久远,编排和内容不一定完整,还请谅解` 中国电信登录RSA算法+分析图文 日期:2016-9-30 ...

  5. SpringBoot+Selenium模拟用户操作浏览器

    Selenium Selenium是一个用于Web应用程序自动化测试的开源工具套件.它主要用于以下目的: 浏览器自动化:Selenium能够模拟真实用户在不同浏览器(如Chrome.Firefox.I ...

  6. 洛谷 P1216 数字三角形

    题目链接:数字三角形 思路 dp:金字塔顶的元素为起点,金字塔每行的最左侧数字只能从上一层的最左侧数字到达,如7 -> 3 -> 8 -> 2 -> 4,这些数字中的每一个(除 ...

  7. linux下安装oracle 11g(静默安装)

    关闭selinux 关闭防火墙 检查安装依赖包 yum -y install binutils compat-libcap1 vsftpd gcc gcc-c++ glibc-devel glibc ...

  8. Linux 特权 SUID/SGID 的详解

    导航 0 前言 1 权限匹配流程 2 五种身份变化 3 有效用户/组 4 特权对 Shell 脚本无效 5 Sudo 与 SUID/SGID 的优先级 6 SUID.SGID.Sticky 各自的功能 ...

  9. Java反射与Fastjson的危险反序列化

    Preface 在前文中,我们介绍了 Java 的基础语法和特性和 fastjson 的基础用法,本文我们将深入学习fastjson的危险反序列化以及预期相关的 Java 概念. 什么是Java反射? ...

  10. 设置Docker容器里的时间

    启动容器时,添加环境变量 docer run -e TZ=Asia/Shanghai --rm myalpine date -e TZ=Asia/Shanghai