原创: 灵魂工作室 速石科技

我猜,我们是最早和你说春天来了的人。

一年前,我们还在小心谨慎地定义着Cloud HPC,一脸娇羞地拿Novartis 诺华制药在5年前做的案例当作标杆。

不久前,Hyperion Research正式宣布2019年是Cloud HPC的转折年。

暴风哭泣,云端高性能计算终于有了姓名。

HPC:HighPerformance Computing高性能计算,换句话说,对算力要求高

这一年,我们帮不少用户落地了云端算力解决方案。像我们老板说的,对用户来说,最重要的是提供一种Accessibility(可触达),后面的Efficiency(效率)都是水到渠成的事儿。

同时,我们也看到很多用户在云的边缘疯狂试探,等某个未知的神秘力量来推上一把;还有些用户惊喜地发现,我们提供了一种解决他们现有问题的新思路。

今天,我们盘一盘国内外Cloud HPC现在的局面:

1. 全球越来越多企业踏足HPC领域,AI和高性能数据分析首当其冲

2. 不同Cloud HPC细分领域未来5年年均复合增长率超过21%

3. 从两个全球超大规模CPU、GPU的溢出到云案例看云的可伸缩弹性能力

4. 我们观察到的国内外部分行业用云现状:制药/基因测序/EDA/CAE/高校

溢出到云:本地不够,云来补上的意思

友情提醒:如果你还在为算力不足而头疼,或对云有所期待,此文建议转发给你的老板,让我们等待一个“真香”~~

全球越来越多企业踏足HPC领域,AI和高性能数据分析首当其冲

全球越来越多企业级用户开始踏足HPC领域,比如欺诈/异常检测、商业智能、关联营销、精准医疗、智慧城市、物联网等等。

大数据和HPC的结合提供了很多新的解决方案,基于HPDA高性能数据分析的AI人工智能,ML机器学习,DL深度学习是最热的领域。

HPDA高性能数据分析领域的增长速度超过HPC市场整体增长速度。

AI领域的增长速度高于整个HPDA高性能数据分析领域的增长速度。

众所周知:AI现在还处在早期发展阶段。推理功能弱,主要解决观察识别类问题,而不是决策问题。比较落地的应用场景是在图像和声音识别,高级驾驶辅助系统,MRI医疗影像识别领域。

AI不是什么包治百病的神奇药丸,不过是数学罢了。

从OPENAI在2019年11月发布的图片中就能明显看出,自2012年以来,AI训练对计算的要求3、4个月就会翻一倍。在可见的未来,这个趋势应该会持续。

不同Cloud HPC细分领域,未来5年年均复合增长率超过21%

Hyperion Research预测未来5年HPC用户的用云趋势:

这个图不包括没有任何本地机器,天生用云的用户。

纵轴指的是用户在第三方云资源上的花费,包括了公有云,混合云,第三方搭建的私有云。

不同Cloud HPC细分领域未来5年年均复合增长率都超过了21%。

生命科学、EDA半导体领域甚至超过了25%。

从两个全球超大规模CPU、GPU的溢出到云案例看云的可伸缩弹性能力

关于为什么要用云这个问题。

Hyperion Research的调查结果跟ANSYS不谋而合。

对用户来说,云的可伸缩弹性是当之无愧的第一大法宝。

那云的弹性现在到底大到什么程度?

我们看看两个全球超大规模CPU、GPU的溢出到云的案例。

CPU。

2019年10月,克莱姆森大学计算学院(Clemson University School of Computing)创下了云端高性能计算领域一个记录。

他们花了大概5万美金,运行了4个小时,使用214万个vCPU在Google云上跑了一个数据密集型应用,在200万小时的视频中对车辆进行计数,视频数据文件大小为210TB。

这是个概念验证实验,为了验证在现实数据量极大,时间紧迫的情况下,云端高性能计算有能力为应急处理提供决策支持。有了云计算,公司或组织不需要拥有大量机器,或者停止手头上一切工作来处理应急情况。

整个计算过程,研究人员对云端实例的弹性使用情况。

GPU。

2019年11月,SDSC圣地亚哥超级计算中心联合威斯康星州冰立方粒子天体物理中心(Wisconsin IceCube Particle Astrophysics Center)在AWS,Azure和Google云上一共调度了超过5万GPU完成一次仿真模拟计算试验。

图片来源:Igor Sfiligoi, SDSC/加州大学圣地亚哥分校
 

黑线是用于计算的GPU数量,最高达到51,500个。

不同颜色代表在某家云厂商的某个区域购买的GPU数量。

PFLOP32s的峰值约为350。

相比之下,美国橡树岭国家实验室Summit系统的名义性能约为400 PFLOP32s。

因此,这次计算,基于云的集群提供了全球排名第一超算中心峰值90%的性能。

IceCube的Riedel说:

“这场实验主要有三个目标:一是用于天体物理学模拟仿真研究;第二是测试网络基础设施是不是做好了未来E级计算的准备;第三是想测一下一个小时左右的时间内,能买到多少商用云计算GPU资源。这次调度了三大洲(北美、欧洲和亚洲)28个区域的所有可用GPU。结果说明云端弹性可以冲击非常大规模的GPU,适用于天文学和其他科学领域的广泛挑战。

我们观察到的国内外部分行业上云现状:制药/基因测序/EDA/CAE/高校

制药/新药研发领域

计算机辅助药物设计(Computer-Aided Drug Design,CADD),国内相比于美国、英国等国家,的确有点落后,但是发展速度非常快,已经成为药物研发流程中不可或缺的一部分。

要求越高越准确,需要的数据就更多,计算量就越大。

怎么利用计算工具和资源,解决新药研发过程中的各种问题?

怎么找到具备复合能力的人才?

是这个领域最受关注的问题。

人才方面,我们可以尽可能帮助企业降低对他们的各种云、HPC技术等方面的知识技能要求,更专注在药物研发业务方向。

计算这一块,拿虚拟筛选来举例。我们能帮助用户让过去需要耗费几个月的筛选时间缩短到1天以内。

案例:我们用Schrodinger(薛定谔)辅助用户对7.8亿多个分子进行了筛选,用了云上的几万个Core,计算时长仅花费了3-13个小时(每个Core上所需时间不一样)。

详情可联系文末小F

基因测序/精准医疗领域

基因测序天然地数据量大,而且计算复杂程度高,整个分析工作流程复杂,经常需要修改算法。

这个领域主要关注测序技术的发展和数据计算和分析。

怎么拿到数据?

怎么在最短时间内对海量生物数据进行计算,找出单个基因或多个基因组合和一系列疾病的关系?

对云的需求主要基于两点:

一个是计算量有明显季节性。而本地计算资源的分析能力有限,升级成本高,云的弹性伸缩能力能很好地应对;

第二是主要是消费级基因公司对计算的时效性要求高

案例:我们有个基因用户就要求8小时内处理完当日5点前数据,而且每天对计算资源的要求很不确定,只有计算时间要求是固定的,这种情况下云端算力就是比较理想的解决方案。而且我们还能将其复杂的分析流程进行优化封装,进一步提升计算效率。

详情可联系文末小F

CAE/CFD领域

ANSYS作为CAE仿真里的巨头,也是目前唯一一个真正采用云端计费模式的企业。他们在2019年5月做的调查显示:云端仿真有很大的增长潜力。

市场变化很快:

在未来的12个月,大多数预计将使用SaaS解决方案(62%),其次是公有云(45%),紧随其后的是混合云解决方案:私有云+合作伙伴管理的数据中心(44%)或私有云+合作伙伴管理的公有云(40%)。

案例:我们帮助一家风电新能源用户优化他们的核心应用Bladed,利用云上更新,主频更高的CPU硬件最大化发挥应用性能,调度任务同时支持本地和云上的Windows节点和Linux节点。

详情可联系文末小F

EDA/半导体

放眼全球,整个半导体产业链核心角色:EDA软件/Foundry/Fabless芯片设计公司/IP厂商无一缺席,早在几年前就在布局上云。三大EDA巨头Synopsys/Cadence/Mentor和芯片制造厂TSMC台积电可以说引领了整个行业。

国内半导体行业已经在暗中追赶。

从AI芯片初创企业到大型Foundry芯片代工厂,从SaaS模式到多区域+多公有云的混合模式,到多云PaaS平台的搭建。我们编了一本《半导体行业解决方案白皮书》。

详情可联系文末小F

接下来几年,我们拭目以待。

高校/科研

高校一直走在科研界的最前沿。但他们面临的问题也十分明显:

  • 人手不足,项目时间有限
  • 不管是云,还是HPC,非计算机专业使用门槛高
  • 本地机器过旧,资源少,申请新机器困难
  • 学校IT支持往往也不足

对很多高校来说,500 core的计算资源峰值需求就足以成为一个障碍。

除了常用的工程应用,生物分析,化学计算等常见高性能计算场景,不少高校和科研院所都在搭建自己的一站式AI计算平台或AI实验室,满足自身人工智能应用创新开发或者学校的AI课程相关实验等需求

在汽车出现之前,我们只想要更快的马。
汽车出现之后带来的很多可能性,在马的时代都是不可想象的。
现在,又到了发挥想象力的时候啦~

祝大年新春大吉鸭!

- END -

我们最近干了件大事!!点开看看?

上榜啦~花费4小时5500美元,速石科技跻身全球超算TOP500

 
扫下图二维码添加小F微信(ID:imfastone)

你也许想再了解一下:

灵魂画师,在线科普多云平台/CMP云管平台/中间件/虚拟化/容器是个啥

云资源中的低成本战斗机——竞价实例,AWS、阿里云等六家云厂商完全用户使用指南

非容器化应用怎么玩多云?Kubernetes不管我们管啊

全球半导体行业上云格局一览和十个上云实践问题的解答

3秒即得最低价,速石上线「多云成本计算器」,来算一下?


速石科技(ID:Fastone_tech)

算力,是一种能力,也是一种资源。

我们为有高算力需求用户提供一站式算力运营解决方案,不局限于HPC,AI,大数据,互联网服务等。希望和你共同建立起不断迭代更新的多云世界观。

(你要是唠这个我就不困了。)

2019-2020春江云暖你先知,CAE/EDA/高校等CloudHPC领域年均复合增长率超21%的更多相关文章

  1. Visual Studio 2019使用码云设置过滤忽略的文件或文件夹(ignore file)

    Visual Studio 2019使用码云的时候,会遇到 “Git failed with a fatal error.error: open(".vs/{{项目名称}}/Server/s ...

  2. 2019年达内云PS淘宝美工平面UI/UX/UE/UED影视后期交互设计师视频

    2019年达内云PS淘宝美工平面UI/UX/UE/UED影视后期交互设计师视频 百度网盘链接一 百度网盘链接二

  3. 2019 GNTC 阿里云参会分享:云原生SDWAN网络2.0 一站式上云服务

    本次10/22-24 南京2019 GNTC大会上,阿里云网络云原生SDWAN网络2.0 由于独特的云原生定位.创新的解决方案,及成熟的应用案例.行业用户,获得行业媒体C114中国通信网.产业专家高度 ...

  4. 2019 GNTC 阿里云参会分享:开放、弹性的阿里云网络NFV平台

    作为全球规模最大的网络技术盛会之一,GNTC全球网络技术大会是网络技术发展的重要风向标,包含战略规划.产业方向.技术趋势.应用创新等皆汇集于此.而作为云服务商代表,阿里云再度受邀以顶级钻石合作伙伴之名 ...

  5. DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路

    简介: 数据库将面临怎样的变革?云原生数据库与数据仓库有哪些独特优势?在日前的 DTCC 2020大会上,阿里巴巴集团副总裁.阿里云数据库产品事业部总裁.ACM杰出科学家李飞飞就<云原生分布式数 ...

  6. 2019 医渡云java面试笔试题 (含面试题解析)

      本人5年开发经验.18年年底开始跑路找工作,在互联网寒冬下成功拿到阿里巴巴.今日头条.医渡云等公司offer,岗位是Java后端开发,因为发展原因最终选择去了医渡云,入职一年时间了,也成为了面试官 ...

  7. 2019.08.02 云从科技C++后台开发

    公司坐标:重庆 岗位:C++后台开发 面试时长:45分钟 主要问题记录: (1)手写代码 冒泡算法的实现: /**   * 冒泡排序:C++   *   * @author skywang   * @ ...

  8. 2019年GPLT L2-4 彩虹瓶 比赛题解 中国高校计算机大赛-团体程序设计天梯赛题解

    彩虹瓶的制作过程(并不)是这样的:先把一大批空瓶铺放在装填场地上,然后按照一定的顺序将每种颜色的小球均匀撒到这批瓶子里. 假设彩虹瓶里要按顺序装 N 种颜色的小球(不妨将顺序就编号为 1 到 N).现 ...

  9. RSA 2019安全大会:企业资产管理成行业新风向标,云上安全占优势

    美国时间3月4-8日,国际知名信息安全峰会RSA Conference在美国旧金山开幕,云安全及云可以为企业提供更可靠的资产管理方式成为大会热点. 此次峰会共吸引全球700多家机构参展,其中近42%为 ...

随机推荐

  1. [转]C#中 ??、 ?、 ?: 、?.、?[ ] 问号

    1. 可空类型修饰符(?) 引用类型可以使用空引用表示一个不存在的值,而值类型通常不能表示为空.例如:string str=null; 是正确的,int i=null; 编译器就会报错.为了使值类型也 ...

  2. (转载)MySQL慢查询日志总结

    转自:https://www.cnblogs.com/kerrycode/p/5593204.html 慢查询日志概念 MySQL的慢查询日志是MySQL提供的一种日志记录,它用来记录在MySQL中响 ...

  3. 阿里云“网红&quot;运维工程师白金:做一个平凡的圆梦人

    他是阿里云的一位 P8 运维专家,却很有野心得给自己取花名“辟拾(P10)”:他没有华丽的履历,仅凭着 26 年的热爱与坚持,一步一个脚印踏出了属于自己的技术逆袭之路:他爱好清奇,练就了能在 20 秒 ...

  4. Android7_安卓的知识体系梳理

    最近梳理了一下安卓的知识体系,先构建一个整体性的认知,也作为以后的学习路线的依据. [一.从原理角度出发]1.Activity生命周期和启动模式2.View的事件体系与工作原理3.四大组件的工作过程4 ...

  5. Android Library的依赖方式及发布(转)

    还是那句老话,好记性不然烂笔头,在此整理 Android Studio 依赖相关 以及 如何发布项目到 JCenter Android Studio 添加依赖Module 依赖module 依赖是指在 ...

  6. Jmeter配置元件——JDBC Connection Configuration参数化

    在昨天Jmeter配置元件——CSV DataSet Config参数化一文中,有提到,在参数化时,还可以使用JDBC Connection Configuration配置元件实现,具体如何实现,如何 ...

  7. Spark RDD的弹性到底指什么

    RDD(Resiliennt Distributed Datasets)抽象弹性分布式数据集对于Spark来说的弹性计算到底提现在什么地方? 自动进行内存和磁盘数据这两种存储方式的切换 Spark 可 ...

  8. 选择合适的最短路--hdu3499

    [题目链接](http://acm.hdu.edu.cn/showproblem.php?pid=3499) 刚看见题目,哦?不就是个最短路么,来,跑一下dijkstra记录最长路除个二就完事了 ,但 ...

  9. no supported authentication methods avaiable

    在git(小乌龟)向github远程推送(push)文件是会报一个异常 no supported authentication methods avaiable 解决方法:因为git(小乌龟)和Git ...

  10. 20191107-8 beta week 2/2 Scrum立会报告+燃尽图 07

    此作业要求参见 http://edu.cnblogs.com/campus/nenu/2019fall/homework/9960 小组名称:“组长”组 组长:杨天宇 组员:魏新,罗杨美慧,王歆瑶,梅 ...