国产AI发展是百家争鸣还是疯狂内卷(内耗)?
本文纯属闲谈(吐槽)
国外搞深度学习弄出了TensorFlow(编译型)以后推到工业界和学术界,但是由于其不好用(太过于复杂),同一时间另一个框架pytorch(非编译型)。由于pytorch是非编译型的框架,所以可以和python紧密结合,更加pythonic,但是性能与TensorFlow有较大差距,并且不原生支持工业界使用,但是由于其好用(学习时间估计是TensorFlow的十分之一),因此慢慢的pytorch使用的人就多了起来,本来pytorch是作为一个实验型产品的,没想到这么多人用,然后Facebook发现这个是好苗子,于是加大投入,在性能上和工业级支持上追赶Tensorflow,最后在和TensorFlow相差不大的情况下完全淘汰了TensorFlow(估计也就Google自己在用,毕竟Google自己家有TPU)。
可以说,虽然美国当年有两个深度学习框架在竞争,但是毕竟是属于两个设计思路,并且是领域刚兴起的时候,谁也不知道那条路可行,因此也就出现了二者竞争的局面。但是现在再看看国内的深度学习框架,简直是琳琅满目,但凡有些积累的AI公司都要搞自己公司的AI计算框架,弄的最后国产的深度学习框架已经几倍于美国的数量了,但是这事是一件好事嘛,我并不这么看。要知道深度学习框架,国内的设计基本是在学TensorFlow和pytorch的,当然现在还有一个Jax,可以说国内的各厂家的深度学习框架基本属于同质化竞争。其实深度学习框架并没有大家想象的那么难做,就像国产的Linux系统一样,一个中小型的公司就完全可以在一两年的时间内手搓一个出来。深度学习框架也是如此,如果使用NVIDIA的GPU,底层库都是美国做好的,你在上层做好调用,弄好自动微分的前向和后向模式,在把基本的CNN、RNN、Attention等kernel函数包装一下,这个深度学习框架也就出来了,这也是为啥和TensorFlow、pytorch同一时间出现的众多美国的开源深度学习框架一样,如果你的编程能力比较OK,你甚至可以手搓一个toy版本的深度学习框架。
其实,重点并不在于深度学习框架具体用哪种方式实现,而是在于如何能使其运算性能更高,更稳定,更易用,有更多的社区用户支持,背后的企业是否能有足够的投资进行维护和升级。国内搞出这么多深度学习框架,就和高校科研所发论文一样,就是为了发而发,就和申请基金和专利一样,你也不要管它好用不好用,反正报上去就能算业绩,来年好评正高级。如果企业也这么高,我想着不是百家争鸣,而是内耗。这么多企业把资金和精力都投入到相同的工作上,最后估计就看哪家企业先放弃。各家AI企业应该搞差异化的工作,而不是搞同质化的工作,就比如搞大语言模型,全国各家AI企业也都是一家搞一个,结果搞出了几百个大模型,我就在想,最后有几个人会使用这几百个大语言模型,又有几个人会去使用国内那么多的深度学习框架。不要忘记,国内的这几百个大语言模型都没有赶上openai的那一个好用,国内的那些数不尽的深度学习框架最后在GitHub上可以看到的项目最终还是pytorch和TensorFlow的。
国产AI发展的内耗我想是短时间内难以终结的,我想最终就要看谁真的能强起来,把其他家都甩在后面,这样其他的企业估计就放弃搞这些同质化的开发了。这就和中国古代的春秋战国一样,最后只有一家实力远超其他家,这个局面才会统一。
PS. 国产的那些深度学习框架,我只用过mindspore,因为只有他家有能力设计芯片并制作芯片(国内代工),而且也只有这家有足够的经济基础,虽然这家是搞销售起家后来以硬件设计著称的,但是这种内卷竞赛玩到最后就是看谁有钱,谁能挺得住,所以我押宝就压这个mindspore了,至于其他国产深度学习框架,那是真的没精力去了解了,太多了,我就用个CNN和RNN,搞出这么多框架,太吓人了,毕竟这个深度学习框架和大语言模型说的再多其本质也无非只是工具,既然手头上有一个好用的锤子了为啥还要研究出那么多长相不同的锤子了,毕竟这东西是用来使用的,而不是用来申请专利的(内涵一下,哈哈哈),不是多多益善,而是好用就够。
国产AI发展是百家争鸣还是疯狂内卷(内耗)?的更多相关文章
- 贾扬清谈大数据&AI发展的新挑战和新机遇
摘要:2019云栖大会大数据&AI专场,阿里巴巴高级研究员贾扬清为我们带来<大数据AI发展的新机遇和新挑战>的分享.本文主要从人工智能的概念开始讲起,谈及了深度学习的发展和模型训练 ...
- 从HashMap面试聊聊互联网内卷
微信公众号:大黄奔跑 关注我,可了解更多有趣的面试相关问题. 写在之前 毫无疑问,回想2020年有什么词出现在眼前最多的,无疑是"996"和"内卷",从马老师的 ...
- 职场「OKR」,魔幻又内卷
个人习惯称之为[O-KR-KPI]组合: 01 从进厂实习那天开始,就接触了KPI的概念: 互联网公司,年初入职,可能因为那天是周五,又赶上月底,少不了要把KPI搬出来折腾一番: 天时,地利,人和: ...
- involution 内卷化
involution 内卷化 虽然不熟悉 involution,但是我想起另外两个常用词:evolution(进化)和 revolution(革命). 它们共同的词根volute,拉丁语原意是&quo ...
- 不权威的国产CPU发展历程
最近进行了一些国产化相关工作 趁着周末有时间,自己整理一下这段时间的学习内容. 毕竟不是处理器和芯片的业内人士,里面多有纰漏,请谅解. 希望可以作为入门学习的简单知识. 1.0 远古时代 unix 世 ...
- 如何看待Android开发的“前景和内卷”
我们首先来意淫一波 5G时代Android即将崛起,Android将与物联网强强联合,配合上5G信息高速传递的模式,再搭配物联网号召的"万物互通"的旗号,同时各位Android开发 ...
- 帮助IT业告别内卷,哪项变革最能被寄予厚望?
近日,中国软件行业协会发布<2021年中国低代码/无代码市场研究报告>,其中提到:我国低代码整体市场规模已达数十亿规模,并将在未来五年保持49.5%的复合增长率.低代码成为整个中国ICT产 ...
- [开源内卷] .NET 定时任务 -- FreeScheduler 支持 cron、持久化、可变定时设置
前言 卷了,卷了,卷了,最近太卷...这篇文章写了好几天了,由于同类型文章太多,排期到今天发布.实在不想卷,得罪了!各位定时任务开源大佬们! .NET 定时组件生态实在太强大了,写下此文只希望能供大家 ...
- 作为一名双非本科毕业的Java程序员,我该如何在日益严重的内卷化中避免被裁?
前言 对一个 Java 程序员而言,并发编程能否熟练掌握是判断他是不是优秀的重要标准之一.因为并发编程在 Java 语言中最为晦涩的知识点,它涉及内存.CPU.操作系统.编程语言等多方面的基础能力,更 ...
- Excel用户如何打破内卷?只需要一个新软件,就能突破excel天花板
还在死磕Excel吗?到底值不值得? 你看看,现在有多少excel培训班和培训课?网上各种EXCEL使用技巧教程也是满天飞.很多人为了提升Excel技能,不遗余力学习各种函数用法.VBA用法等等,最近 ...
随机推荐
- ETL工具-nifi干货系列 第十七讲 nifi Input Port&Out Port 实战教程
1.端口(Port),包含输入端口(Input Port)和输出端口(Out Port ) 使用一个或多个处理组构建的数据流需要一种方式将处理组连接到其他数据流组件. 处理组和处理组之间可以通过使用端 ...
- 手把手教你免费用Flashduty做消息通知
为什么需要消息通知? 如果有重要的情况发生,希望能通过各种媒介通知我们.可以举几个例子: 家里燃气费没有了,希望能有短信或者app通知 api频繁500报错,希望及时感知,及时修复 公司网站是http ...
- PHP 程序员转 Go 语言的经历分享
大家好,我是码农先森. 之前有朋友让我分享从 PHP 转 Go 的经历,这次它来了.我主要从模仿.进阶.应用这三个方面来描述转 Go 的经历及心得.模仿是良好的开端,进阶是艰难的成长,应用是认知的提升 ...
- 常用的jvm一些监控命令
一.jmap 查看堆内对象示例的统计信息 jmap -heap pid 描述:查看堆信息 jmap -histo:live pid | head -30 描述:显示堆中对象的统计信息 命令:jmap ...
- Linux下挂载NTFS格式的U盘
NTFS是Windows下的格式,在Linux下是识别不了的,要想在Linux上挂载NTFS格式的U盘需要安装软件以提供支持.软件名为ntfs-3g. 1.下载安装包 https://tuxera.c ...
- 【深度学习 有效炼丹】多GPU使用教程, DP与DDP对比, ray多线程并行处理等 [GPU利用率低的分析]
️ 前言 更新日志: 20220404:新增一个DDP 加载模型时显存分布不均问题,见目录遇到的问题及解决处 主要是上次server12 被自己一个train 直接线程全部拉满了(没错 ... ser ...
- HTTP事务理解
借图: 首先三次握手理解: TCP三次握手好比两个对话, 第一次握手:甲给乙一直发送信息,乙没有回应,甲不知道乙有没有收到信息 第二次握手:乙收到信息,然后再给甲回信息,此时甲知道乙收到信息,但乙不知 ...
- sqlCel查询一个表中部分字段的数据后插入到另一个表中
问题: 部门每天需要从后台系统将物流总表数据导出,Excel中整理出订单的物流发货渠道和发货时间,再手动导入到数据库中,整个过程不麻烦,但在Excel中比较繁琐. 需求: 将这个繁琐的过程变得更简单, ...
- Nunjucks
Nunjucks是什么东东?其实它是一个模板引擎. 那什么是模板引擎? 模板引擎就是基于模板配合数据构造出字符串输出的一个组件.比如下面的函数就是一个模板引擎: function examResult ...
- (五)Redis 缓存异常、应对策略
1.缓存和数据库不一致 只要我们使用 Redis 缓存,就必然会面对缓存和数据库间的一致性保证问题,这里的"一致性"包含了两种情况:缓存中有数据且与数据库中的值相同.缓存中没有数据 ...