2019-2020春江云暖你先知,CAE/EDA/高校等CloudHPC领域年均复合增长率超21%
原创: 灵魂工作室 速石科技

我猜,我们是最早和你说春天来了的人。
一年前,我们还在小心谨慎地定义着Cloud HPC,一脸娇羞地拿Novartis 诺华制药在5年前做的案例当作标杆。
不久前,Hyperion Research正式宣布2019年是Cloud HPC的转折年。
暴风哭泣,云端高性能计算终于有了姓名。
HPC:HighPerformance Computing高性能计算,换句话说,对算力要求高
这一年,我们帮不少用户落地了云端算力解决方案。像我们老板说的,对用户来说,最重要的是提供一种Accessibility(可触达),后面的Efficiency(效率)都是水到渠成的事儿。
同时,我们也看到很多用户在云的边缘疯狂试探,等某个未知的神秘力量来推上一把;还有些用户惊喜地发现,我们提供了一种解决他们现有问题的新思路。
今天,我们盘一盘国内外Cloud HPC现在的局面:
1. 全球越来越多企业踏足HPC领域,AI和高性能数据分析首当其冲
2. 不同Cloud HPC细分领域未来5年年均复合增长率超过21%
3. 从两个全球超大规模CPU、GPU的溢出到云案例看云的可伸缩弹性能力
4. 我们观察到的国内外部分行业用云现状:制药/基因测序/EDA/CAE/高校
溢出到云:本地不够,云来补上的意思
友情提醒:如果你还在为算力不足而头疼,或对云有所期待,此文建议转发给你的老板,让我们等待一个“真香”~~
全球越来越多企业踏足HPC领域,AI和高性能数据分析首当其冲
全球越来越多企业级用户开始踏足HPC领域,比如欺诈/异常检测、商业智能、关联营销、精准医疗、智慧城市、物联网等等。
大数据和HPC的结合提供了很多新的解决方案,基于HPDA高性能数据分析的AI人工智能,ML机器学习,DL深度学习是最热的领域。
HPDA高性能数据分析领域的增长速度超过HPC市场整体增长速度。
AI领域的增长速度高于整个HPDA高性能数据分析领域的增长速度。
众所周知:AI现在还处在早期发展阶段。推理功能弱,主要解决观察识别类问题,而不是决策问题。比较落地的应用场景是在图像和声音识别,高级驾驶辅助系统,MRI医疗影像识别领域。
AI不是什么包治百病的神奇药丸,不过是数学罢了。
从OPENAI在2019年11月发布的图片中就能明显看出,自2012年以来,AI训练对计算的要求3、4个月就会翻一倍。在可见的未来,这个趋势应该会持续。
不同Cloud HPC细分领域,未来5年年均复合增长率超过21%
Hyperion Research预测未来5年HPC用户的用云趋势:
这个图不包括没有任何本地机器,天生用云的用户。
纵轴指的是用户在第三方云资源上的花费,包括了公有云,混合云,第三方搭建的私有云。
不同Cloud HPC细分领域未来5年年均复合增长率都超过了21%。
生命科学、EDA半导体领域甚至超过了25%。
从两个全球超大规模CPU、GPU的溢出到云案例看云的可伸缩弹性能力
关于为什么要用云这个问题。
Hyperion Research的调查结果跟ANSYS不谋而合。
对用户来说,云的可伸缩弹性是当之无愧的第一大法宝。
那云的弹性现在到底大到什么程度?
我们看看两个全球超大规模CPU、GPU的溢出到云的案例。
CPU。
2019年10月,克莱姆森大学计算学院(Clemson University School of Computing)创下了云端高性能计算领域一个记录。
他们花了大概5万美金,运行了4个小时,使用214万个vCPU在Google云上跑了一个数据密集型应用,在200万小时的视频中对车辆进行计数,视频数据文件大小为210TB。
这是个概念验证实验,为了验证在现实数据量极大,时间紧迫的情况下,云端高性能计算有能力为应急处理提供决策支持。有了云计算,公司或组织不需要拥有大量机器,或者停止手头上一切工作来处理应急情况。
GPU。
2019年11月,SDSC圣地亚哥超级计算中心联合威斯康星州冰立方粒子天体物理中心(Wisconsin IceCube Particle Astrophysics Center)在AWS,Azure和Google云上一共调度了超过5万GPU完成一次仿真模拟计算试验。
黑线是用于计算的GPU数量,最高达到51,500个。
不同颜色代表在某家云厂商的某个区域购买的GPU数量。
PFLOP32s的峰值约为350。
相比之下,美国橡树岭国家实验室Summit系统的名义性能约为400 PFLOP32s。
因此,这次计算,基于云的集群提供了全球排名第一超算中心峰值90%的性能。
IceCube的Riedel说:
“这场实验主要有三个目标:一是用于天体物理学模拟仿真研究;第二是测试网络基础设施是不是做好了未来E级计算的准备;第三是想测一下一个小时左右的时间内,能买到多少商用云计算GPU资源。这次调度了三大洲(北美、欧洲和亚洲)28个区域的所有可用GPU。结果说明云端弹性可以冲击非常大规模的GPU,适用于天文学和其他科学领域的广泛挑战。”
我们观察到的国内外部分行业上云现状:制药/基因测序/EDA/CAE/高校
制药/新药研发领域
计算机辅助药物设计(Computer-Aided Drug Design,CADD),国内相比于美国、英国等国家,的确有点落后,但是发展速度非常快,已经成为药物研发流程中不可或缺的一部分。
要求越高越准确,需要的数据就更多,计算量就越大。
怎么利用计算工具和资源,解决新药研发过程中的各种问题?
怎么找到具备复合能力的人才?
是这个领域最受关注的问题。
人才方面,我们可以尽可能帮助企业降低对他们的各种云、HPC技术等方面的知识技能要求,更专注在药物研发业务方向。
计算这一块,拿虚拟筛选来举例。我们能帮助用户让过去需要耗费几个月的筛选时间缩短到1天以内。
案例:我们用Schrodinger(薛定谔)辅助用户对7.8亿多个分子进行了筛选,用了云上的几万个Core,计算时长仅花费了3-13个小时(每个Core上所需时间不一样)。
详情可联系文末小F
基因测序/精准医疗领域
基因测序天然地数据量大,而且计算复杂程度高,整个分析工作流程复杂,经常需要修改算法。
这个领域主要关注测序技术的发展和数据计算和分析。
怎么拿到数据?
怎么在最短时间内对海量生物数据进行计算,找出单个基因或多个基因组合和一系列疾病的关系?
对云的需求主要基于两点:
一个是计算量有明显季节性。而本地计算资源的分析能力有限,升级成本高,云的弹性伸缩能力能很好地应对;
第二是主要是消费级基因公司对计算的时效性要求高。
案例:我们有个基因用户就要求8小时内处理完当日5点前数据,而且每天对计算资源的要求很不确定,只有计算时间要求是固定的,这种情况下云端算力就是比较理想的解决方案。而且我们还能将其复杂的分析流程进行优化封装,进一步提升计算效率。
详情可联系文末小F
CAE/CFD领域
ANSYS作为CAE仿真里的巨头,也是目前唯一一个真正采用云端计费模式的企业。他们在2019年5月做的调查显示:云端仿真有很大的增长潜力。
市场变化很快:
在未来的12个月,大多数预计将使用SaaS解决方案(62%),其次是公有云(45%),紧随其后的是混合云解决方案:私有云+合作伙伴管理的数据中心(44%)或私有云+合作伙伴管理的公有云(40%)。
案例:我们帮助一家风电新能源用户优化他们的核心应用Bladed,利用云上更新,主频更高的CPU硬件最大化发挥应用性能,调度任务同时支持本地和云上的Windows节点和Linux节点。
详情可联系文末小F
EDA/半导体
放眼全球,整个半导体产业链核心角色:EDA软件/Foundry/Fabless芯片设计公司/IP厂商无一缺席,早在几年前就在布局上云。三大EDA巨头Synopsys/Cadence/Mentor和芯片制造厂TSMC台积电可以说引领了整个行业。
国内半导体行业已经在暗中追赶。
从AI芯片初创企业到大型Foundry芯片代工厂,从SaaS模式到多区域+多公有云的混合模式,到多云PaaS平台的搭建。我们编了一本《半导体行业解决方案白皮书》。
详情可联系文末小F
接下来几年,我们拭目以待。
高校/科研
高校一直走在科研界的最前沿。但他们面临的问题也十分明显:
- 人手不足,项目时间有限
- 不管是云,还是HPC,非计算机专业使用门槛高
- 本地机器过旧,资源少,申请新机器困难
- 学校IT支持往往也不足
对很多高校来说,500 core的计算资源峰值需求就足以成为一个障碍。
除了常用的工程应用,生物分析,化学计算等常见高性能计算场景,不少高校和科研院所都在搭建自己的一站式AI计算平台或AI实验室,满足自身人工智能应用创新开发或者学校的AI课程相关实验等需求。
在汽车出现之前,我们只想要更快的马。
汽车出现之后带来的很多可能性,在马的时代都是不可想象的。
现在,又到了发挥想象力的时候啦~
祝大年新春大吉鸭!
- END -
我们最近干了件大事!!点开看看?

你也许想再了解一下:
灵魂画师,在线科普多云平台/CMP云管平台/中间件/虚拟化/容器是个啥
云资源中的低成本战斗机——竞价实例,AWS、阿里云等六家云厂商完全用户使用指南
速石科技(ID:Fastone_tech)
算力,是一种能力,也是一种资源。
我们为有高算力需求用户提供一站式算力运营解决方案,不局限于HPC,AI,大数据,互联网服务等。希望和你共同建立起不断迭代更新的多云世界观。
(你要是唠这个我就不困了。)
2019-2020春江云暖你先知,CAE/EDA/高校等CloudHPC领域年均复合增长率超21%的更多相关文章
- Visual Studio 2019使用码云设置过滤忽略的文件或文件夹(ignore file)
Visual Studio 2019使用码云的时候,会遇到 “Git failed with a fatal error.error: open(".vs/{{项目名称}}/Server/s ...
- 2019年达内云PS淘宝美工平面UI/UX/UE/UED影视后期交互设计师视频
2019年达内云PS淘宝美工平面UI/UX/UE/UED影视后期交互设计师视频 百度网盘链接一 百度网盘链接二
- 2019 GNTC 阿里云参会分享:云原生SDWAN网络2.0 一站式上云服务
本次10/22-24 南京2019 GNTC大会上,阿里云网络云原生SDWAN网络2.0 由于独特的云原生定位.创新的解决方案,及成熟的应用案例.行业用户,获得行业媒体C114中国通信网.产业专家高度 ...
- 2019 GNTC 阿里云参会分享:开放、弹性的阿里云网络NFV平台
作为全球规模最大的网络技术盛会之一,GNTC全球网络技术大会是网络技术发展的重要风向标,包含战略规划.产业方向.技术趋势.应用创新等皆汇集于此.而作为云服务商代表,阿里云再度受邀以顶级钻石合作伙伴之名 ...
- DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路
简介: 数据库将面临怎样的变革?云原生数据库与数据仓库有哪些独特优势?在日前的 DTCC 2020大会上,阿里巴巴集团副总裁.阿里云数据库产品事业部总裁.ACM杰出科学家李飞飞就<云原生分布式数 ...
- 2019 医渡云java面试笔试题 (含面试题解析)
本人5年开发经验.18年年底开始跑路找工作,在互联网寒冬下成功拿到阿里巴巴.今日头条.医渡云等公司offer,岗位是Java后端开发,因为发展原因最终选择去了医渡云,入职一年时间了,也成为了面试官 ...
- 2019.08.02 云从科技C++后台开发
公司坐标:重庆 岗位:C++后台开发 面试时长:45分钟 主要问题记录: (1)手写代码 冒泡算法的实现: /** * 冒泡排序:C++ * * @author skywang * @ ...
- 2019年GPLT L2-4 彩虹瓶 比赛题解 中国高校计算机大赛-团体程序设计天梯赛题解
彩虹瓶的制作过程(并不)是这样的:先把一大批空瓶铺放在装填场地上,然后按照一定的顺序将每种颜色的小球均匀撒到这批瓶子里. 假设彩虹瓶里要按顺序装 N 种颜色的小球(不妨将顺序就编号为 1 到 N).现 ...
- RSA 2019安全大会:企业资产管理成行业新风向标,云上安全占优势
美国时间3月4-8日,国际知名信息安全峰会RSA Conference在美国旧金山开幕,云安全及云可以为企业提供更可靠的资产管理方式成为大会热点. 此次峰会共吸引全球700多家机构参展,其中近42%为 ...
随机推荐
- [转]C#中 ??、 ?、 ?: 、?.、?[ ] 问号
1. 可空类型修饰符(?) 引用类型可以使用空引用表示一个不存在的值,而值类型通常不能表示为空.例如:string str=null; 是正确的,int i=null; 编译器就会报错.为了使值类型也 ...
- (转载)MySQL慢查询日志总结
转自:https://www.cnblogs.com/kerrycode/p/5593204.html 慢查询日志概念 MySQL的慢查询日志是MySQL提供的一种日志记录,它用来记录在MySQL中响 ...
- 阿里云“网红"运维工程师白金:做一个平凡的圆梦人
他是阿里云的一位 P8 运维专家,却很有野心得给自己取花名“辟拾(P10)”:他没有华丽的履历,仅凭着 26 年的热爱与坚持,一步一个脚印踏出了属于自己的技术逆袭之路:他爱好清奇,练就了能在 20 秒 ...
- Android7_安卓的知识体系梳理
最近梳理了一下安卓的知识体系,先构建一个整体性的认知,也作为以后的学习路线的依据. [一.从原理角度出发]1.Activity生命周期和启动模式2.View的事件体系与工作原理3.四大组件的工作过程4 ...
- Android Library的依赖方式及发布(转)
还是那句老话,好记性不然烂笔头,在此整理 Android Studio 依赖相关 以及 如何发布项目到 JCenter Android Studio 添加依赖Module 依赖module 依赖是指在 ...
- Jmeter配置元件——JDBC Connection Configuration参数化
在昨天Jmeter配置元件——CSV DataSet Config参数化一文中,有提到,在参数化时,还可以使用JDBC Connection Configuration配置元件实现,具体如何实现,如何 ...
- Spark RDD的弹性到底指什么
RDD(Resiliennt Distributed Datasets)抽象弹性分布式数据集对于Spark来说的弹性计算到底提现在什么地方? 自动进行内存和磁盘数据这两种存储方式的切换 Spark 可 ...
- 选择合适的最短路--hdu3499
[题目链接](http://acm.hdu.edu.cn/showproblem.php?pid=3499) 刚看见题目,哦?不就是个最短路么,来,跑一下dijkstra记录最长路除个二就完事了 ,但 ...
- no supported authentication methods avaiable
在git(小乌龟)向github远程推送(push)文件是会报一个异常 no supported authentication methods avaiable 解决方法:因为git(小乌龟)和Git ...
- 20191107-8 beta week 2/2 Scrum立会报告+燃尽图 07
此作业要求参见 http://edu.cnblogs.com/campus/nenu/2019fall/homework/9960 小组名称:“组长”组 组长:杨天宇 组员:魏新,罗杨美慧,王歆瑶,梅 ...