中国超级计算机为什么不能为AI提供算力?
网上看到这样的帖子:
https://www.zhihu.com/question/609008408/answer/3130831897

==========================================================
我个人搞了十多年的计算机,其中大部分时间都是搞AI相关,10多年前的时候就学过cuda编写bp模型,可以说算得上国内这领域的老鸟了,前段时间阴差阳错的成为了东北沿海某城市的AI计算中心的准总监(技术leader),虽然后来感觉待遇各方面不是很满意而选择回村种地,但是对于AI计算中心的超算平台一直难于进行AI算力的提供却有着比较深的切身体会。
个人的总结是两点:
一是费用问题:
或者说是性价比的问题,要知道大部分的AI任务都不需要太多的计算资源(这里指的是几十块甚至上百块显卡,上百个CPU甚至上千的CPU),一般的AI任务往往就是一个CPU+一个RTX4090显卡就够,总的造价在2W以内,而你要知道在超算平台的AI设备上只要你运行就是一个小时20多元甚至40元、50元,换句话说同样的钱自己买个设备用上5年都可以,但是用超算中心的设备也就是一个月不到就花光的钱,因此小规模的计算(20卡以内的)任务我所接触到的都是自建运算环境,而不是去买所谓的超算平台的AI算力,当然你如果是国家科研单位的那就不用怕,就像我在某沿海985大学读书的时候所有的花销都是走国家级项目报销的,自然也就不存在费用这个问题了,而这个问题对于中小型的企业来说却很致命,因为对于中小型企业来说根本这就是不划算的买卖。对于为什么超算平台的费用一直无法降呢,我想这里面有设备费用、人员维护费用、电费、空调费、场地建设费等等在里面,就拿其中的电费来说,超算中心假如有1000个服务器,它的负载只有10%,那它也绝对不可以把不用的900台服务器关机来省电,而在一个中小企业来说它就是可以把没有计算任务的服务器关机来省电的,也正是因为这样的问题所以导致超算中心的使用费用无法降低,而中小企业又难以接受超算中心如此不具备性价比的方案。
二是技术问题:
前面说的费用问题或许还能要人容易理解,但是后面的技术问题可能确实要一些不了解的人搞不清楚情况,这一个个超算中心都是几十亿上百亿的投资,怎么还会存在技术问题解决不了呢,这花钱不就行了吗,但是这确实是现实情况。国家级别的超算我没有管过,这是实话,但是省市一级的我却比较有经验了,这里说的也是这种情况,这些超算中心往往没有专门的技术人员来管理,所谓的挂名的技术人员也就只是国企、事业单位中的普通的所谓的“技术人员”,如果你想指望这些人员能够提供什么服务那就是多想了的。而一些企业的自建对外的超算中心,比如某个做路由器交换机起家的手机厂商也是以销售为主,并不以技术服务为主,说的直白一些就是只管卖而不管技术维护,而实际上使用超算往往是在技术上要难以单机模式下的,这个超算平台的软件安装,环境配置以及用户的project中代码的适配都是需要专业技术人员来服务的,而这些事情对于现在国内的省市一级的超算往往是无法做到的,这些超算中心的技术leader往往都是当地的985高校的博士生、研究生,一般都是院长博导的嫡系学生,和上面说的上话那种的学生,然后给推到这些铁饭碗的单位,这也就在某种程度上印证了那么一句话,那就是“国企事业单位是没有真正意义上的技术岗位的”。
总的来说,国内的超算平台一个是费用太高难以接受,一个是无人维护和管理而导致难以使用,或许这就是国内超算AI平台的现状吧。
-------------------------------------------------------------------
国内的超算平台一般都是异构计算模式,当然也有一部分是只提供CPU服务的,不过大部分都是CPU+GPU的异构计算,那主机一个个都是A100的卡,看着这些卡空着有时也感慨国家这么大的资金投入也就是打了水漂了,毕竟这成百亿上千亿的钱造航空母舰估计都够造好几个的了。
-------------------------------------------------------------------
中国超级计算机为什么不能为AI提供算力?的更多相关文章
- 谷歌AI中国中心成立,人工智能势不可挡?
昨日,谷歌在上海举办了一年一度的Google中国开发者大会.在本届大会上,谷歌云首席科学家李飞飞宣布了一个重磅消息,即在北京将成立谷歌AI中国中心.对于这个即将成立的AI中心谷歌寄予厚望,希望与中国本 ...
- 谷歌 AI 中国中心成立,人工智能势不可挡?
昨日,谷歌在上海举办了一年一度的Google中国开发者大会.在本届大会上,谷歌云首席科学家李飞飞宣布了一个重磅消息,即在北京将成立谷歌AI中国中心.对于这个即将成立的AI中心谷歌寄予厚望,希望与中国本 ...
- 警告!中国90%AI初创企业将在两年内落败出局
https://mp.weixin.qq.com/s/-RkyLda1jovaHBlBTsi-BA 近年来,中国涌现了一大批AI初创企业,但AI热潮也伴随着泡沫.由于近期市场资金紧缩,投资者发出警告, ...
- 高盛为什么认为中国AI领域将超越美国?
不久前,高盛发布的名为<中国在人工智能领域崛起>的研究报告,报告中,高盛认为中国已经成为AI领域的主要竞争者,中国政府建设“智慧型经济”和“智慧社会”的目标将有可能推动中国未来GDP的增长 ...
- 深度 | AI芯片终极之战
深度 | AI芯片终极之战 https://mp.weixin.qq.com/s?__biz=MzA4MTQ4NjQzMw==&mid=2652712307&idx=1&sn= ...
- AI生万物,新世界的大门已敞开
四月是万物复苏的时节,一年一度的GMIC全球移动互联网大会也在这个时间如期而至,在4月26日-28日的会议期间,有超过三百位行业专家进行了精彩的演讲,更有数万名现场观众感受到思维碰撞迸发出的火花. 作 ...
- 一文解读AI芯片之间的战争 (转)
2015年的秋天,北京的雨水比往年要多些,温度却不算太冷.这一年里,年仅23岁的姚颂刚刚拿到清华大学的毕业证书;32岁的陈天石博士毕业后已在中科院计算所待了整整8年;而在芯片界摸爬滚打了14年的老将何 ...
- 星际争霸的虫王IA退役2年搞AI,自叹不如了
------------恢复内容开始------------ 金磊 发自 凹非寺 量子位|公众号 QbitA 这年头,直播讲AI,真算不上什么新鲜事.但要是连职业电竞选手,都开播主讲呢?没开玩笑,是真 ...
- 亚马逊云科技现身世界人工智能大会,揭示AI最新技术趋势
2022世界人工智能大会(WAIC)于日前落幕.经过过去四届的发展与沉淀,今天的世界人工智能大会已成为人工智能领域最有影响力的国际盛会之一,今年大咖云集.国际大厂扎堆,充分彰显了大会的国际影响力和磁力 ...
- 我们距离AI编程还有多远?
近几年来,人工智能的信息以不同形式霸占着我们的眼球,我们知道AlphaGo.微软小冰.Sophia,了解过自动驾驶.无人机.智能家居等,深知人工智能是在记忆力.学习力.运算力方面都远超人类的存在,但人 ...
随机推荐
- C# JAVA UrlEncode
C# JAVA urlencode 默认是不兼容的.C# 需要encode的部分是小写.JAVA 需要encode的部分是大写. /// <summary> /// java UrlEn ...
- 打开TLS 1.1和1.2而不影响其他协议
打开TLS 1.1和1.2而不影响其他协议 System.Net.ServicePointManager.SecurityProtocol |= SecurityProtocolType.Tls11 ...
- C#.NET AES ECB 加密
加密: /// <summary> /// 加密 /// </summary> /// <param name="content">要加密的串& ...
- Spring扩展——BeanFactory和FactoryBean
BeanFactory和FactoryBean BeanFactory和FactoryBean长得很相似,也很容易让我们产生误解,特别是对于初学者而言,搞懂他俩关系非常有必要,因为这两个接口,是Spr ...
- des加密,url编码,url解码,des解密 DES加解密及Wrong key size错误处理
des加密,url编码,url解码,des解密 DES加解密及Wrong key size错误处理 package com.example.core.mydemo.des; import javax. ...
- Sealos 5.0 正式发布,云本应该是操作系统
把所有资源抽象成一个整体,一切皆应用,这才是云应该有的样子. 2018 年 8 月 15 日 Sealos 提交了第一行代码. 随后开源社区以每年翻倍的速度高速增长. 2022 年我们正式创业,经历一 ...
- Lru-k在Rust中的实现及源码解析
LRU-K 是一种缓存淘汰算法,旨在改进传统的LRU(Least Recently Used,最近最少使用)算法的性能.将其中高频的数据达到K次访问移入到另一个队列进行保护. 算法思想 LRU-K中的 ...
- 交通规划四阶段法:基于 Python 的交通分布预测算法复现 - 附完整代码链接
目录 交通规划四阶段法:基于 Python 的交通分布预测算法复现 - 附完整代码链接 我只是想使用这些代码 下载代码文件 代码的使用方法 合作 部分代码内容的展示 交通规划四阶段法:基于 Pytho ...
- python爬虫-request模块
1. requests 中的请求方法 HTTP 请求方法: requests.get(url, params=None, **kwargs) # GET 请求 requests.post(url, d ...
- 【基础整理】Mapping representation 机器人所用地图种类及相关介绍
参考与前言 本文主要介绍 建图 Mapping 方面的一些 基础知识介绍与相关下游任务使用 涉及知识较为基础,SLAM大佬们可以提前退出了 主要针对应用为移动机器人与物流无人驾驶车:提前申明:大部分文 ...