威盛x86 AI处理器架构、性能公布:媲美Intel 32核心

https://www.cnbeta.com/articles/tech/920559.htm

除了Intel、AMD,宝岛台湾的威盛也会造x86处理器的,不知道还有多少人知道?最近,威盛旗下已有24年历史的处理器研发部门CenTaur开发出了世界上第一个集成AI协处理器的x86处理器,并有了可工作的原型,今年9月份开始芯片测试。

新处理器采用台积电16nm工艺制造,内核面积不超过195平方毫米,内部采用环形总线设计,串联集成八个x86 CPU核心、16MB共享三级缓存、四通道DDR4-3200内存控制器、PCIe 3.0控制器(44条)、南桥和IO功能,是一颗完整的SoC。

最大亮点是AI协处理器“NCORE”,占用面积约34.4平方毫米(17.6%),软件映射为PCI设备,支持DNN深度神经网络创建与训练的加速,号称可提供多达20TB/s的内存带宽、每秒20万亿次AI操作的性能。

主频可以工作在2.5GHz,而且竟然支持AVX-512指令集,这可是AMD Zen 2架构都没有的。

CHA处理器内核图

CHA处理器模块简图

近日,Centaur公布了这颗处理器的诸多架构细节,但有趣的是并非自行公布,而是来自美国加州处理器技术权威机构、 著名芯片杂志《Microprocessor Report》发行商Linley Group,后者仔细研究了Centaur的处理器架构设计文档,并采访了相关设计师,给出了这份报告。

《Microprocessor Report》杂志主编Linley Gwennap对这颗全新设计的x86处理器不吝溢美之词:“Centaur高调重返x86市场,带来了革新的处理器设计,整个八个高性能CPU核心、一个定制深度学习加速器(DLA)。这是业界第一个集成DLA的服务器处理器设计。新的加速器NCore的神经网络性能甚至比最强大的至强还要好,而且不需要昂贵的外部GPU计算卡辅助。”

Linley Group透露,Centaur的全新x86微架构叫做“CNS”,设计目标是IPC要高于传统PC处理器,每时钟周期可解码4条x86指令,并行执行10个微操,首颗处理器暂命名“CHA”,其中AI协处理器INT8整数的峰值性能高达20TOPS(20万亿次操作每秒)。

CNS微架构图

NCore AI协处理器架构图

Linley Group基于权威的MLPerf性能测试来衡量x86处理器的AI性能,结果发现Centaur CHA处理器的AI推理性能,相当于23个世界级的Intel x86核心,而且后者必须是支持512位的VNNI矢量神经网络指令才行。——事实上,Intel现在还没有真正的32核心产品。

Centaur AI协处理器的架构设计类似VNNI指令的SIMD(单指令多数据)理念,但是在16MB专用内存、20TB/s带宽的支持下,每个时钟周期可以处理32768个数据位,而且将推理处理交给专门的AI协处理器后,x86核心就可以放心执行其他通用任务。

Centaur还为开发者提供了新的算法,可充分利用Centaru AI协处理器无与伦比的超低推理延迟,并与x86 CPU核心密切配合。

在纽约州举办的ISC East大会上,Centaur还首次公开展示了CHA处理器,而且除了视频分析、实时物体检测和分类等传统AI应用之外,还唯一秀了一把语义分割(像素级图像分类)、人体姿态估计(简笔画)等前沿应用,让人大开眼界。

目前,Centaur正在改进优化新平台的硬件性能、软件效率,而新处理器预计明年下半年正式投产。

Linley Group的详细报告可以点击这里下载

不同CPU架构的对比


Centaur处理器测试中

【转帖】威盛x86 AI处理器架构、性能公布:媲美Intel 32核心的更多相关文章

  1. 所生成项目的处理器架构“MSIL”与引用“Microsoft.AspNet.Scaffolding.12.0, Version=12.0.0.0, Culture=neutral, PublicKeyToken=b03f5f7f11d50a3a, processorArchitecture=x86”的处理器架构“x86”不匹配。

    生成成功后: 3>C:\Program Files (x86)\MSBuild\14.0\bin\Microsoft.Common.CurrentVersion.targets(1820,5): ...

  2. 【读一本书】《昇腾AI处理器架构与编程》--神经网络基础知识(2)

    1 卷积神经网络:输入层 之前提到多层感知机的参数太多,导致训练耗时长并且对图像处理也不具有优势,因此大神们 就提出了多层神经网络,其中最经典的是卷积神经网络(Convolution Neural N ...

  3. C# 所生成项目的处理器架构“MSIL”与引用“Oracle.DataAccess, Version=4.112.3.0, Culture=neutral, PublicKeyToken=89b483f429c47342, processorArchitecture=x86”的处理器架构“x86”不匹配。这种不匹配可能会导致运行时失败。

    这个问题一般都是Oracle.DataAccess的版本不兼容问题造成的. 解决办法: 1.把Oracle.DataAccess.dll文件拿到C盘或D盘的安装文件的地方进行搜索. 2.会出现在pro ...

  4. ARM、X86和AI处理器的区别

    ARM.X86和AI处理器的区别 目前主要的处理器架构有: X86: Intel, AMD, 海光, 兆芯 ARM: 华为,飞腾,华芯通,Cavium,Ampere,富士通,亚马逊 POWER:IBM ...

  5. [转帖]又一国产x86处理器可大规模上市:Intel至强核心 安全监测管控

    又一国产x86处理器可大规模上市:Intel至强核心 安全监测管控 https://www.cnbeta.com/articles/tech/850525.htm 不知道是不是有一起汉芯事件 国产CP ...

  6. [转帖]龙芯3A4000处理器实测:28nm工艺不变 性能仍可提升100%以上

    龙芯3A4000处理器实测:28nm工艺不变 性能仍可提升100%以上 http://news.mydrivers.com/1/663/663122.htm 龙芯是中科院下属的计算机所研发的自主产权国 ...

  7. 32位x86处理器架构

    我们看看32 位 x86 处理器的基本架构特点.这些处理器包括了 Intel IA-32 系列中的成员和所有 32 位 AMD 处理器. 操作模式 x86 处理器有三个主要的操作模式:保护模式.实地址 ...

  8. 所生成项目的处理器架构“MSIL”与引用“***”的处理器架构“x86”不匹配。这种不匹配可能会导致运行时失败。请考虑通过配置管理器...

    警告:所生成项目的处理器架构“MSIL”与引用“***”的处理器架构“x86”不匹配.这种不匹配可能会导致运行时失败.请考虑通过配置管理器更改您的项目的目标处理器架构,以使您的项目与引用间的处理器架构 ...

  9. VS中C#连接SQLite数据库处理器架构“x86”不匹配的问题

    原文链接 https://www.cnblogs.com/zhaoliankun/p/9088200.html 我的环境配置:windows 64,VS,SQLite(点击下载),System.Dat ...

随机推荐

  1. 简述Linux开机启动流程

    计算机开机是一个神秘的过程.我们只是按了开机键,就看到屏幕上的进度条或者一行行的输出,直到我们到达登录界面.然而,计算机开机又是个异常脆弱的过程,我们满心期望的登录界面可能并不会出现,而是一个命令行或 ...

  2. Lucene PriorityQueue & JDK PriorityQueue

    麻蛋,原来是最小堆呀!  数据结构不熟害死人呀! 看来待复习复习数据结构了 在lucene源码中对多个段合并的时候,会先将多个段放到一个PriorityQueue中,不要被这个名字迷惑,这个Prior ...

  3. iOS - 逆向调试自用工具(reveal 14 Hopper Go2Shell ifunboxmac MachOView Alfred Go2Shell iTerm)

    研究了挺长一段时间的逆向感觉没啥可弄的了,再深处对我也用处不大,渐渐兴趣有些掉头了.最近有问我要工具的朋友,分享一些常用工具给用到的朋友. 用法自己百度吧,这里不再赘述. 图例(希望看到你想要的): ...

  4. ASP.NET Core使用EPPlus导入导出Excel

    开发过程中,经常会遇到导入导出数据的需求,本篇博客介绍在.NET Core中如何使用EPPlus组件导入导出Excel EPPlus: EPPlus是使用Open Office XML格式(xlsx) ...

  5. css1.0~3.0背景图使用多张折叠的概念与方法

    需求:使用多张图片作为页面的背景图: 首先需要了解background的属性以及细节知识:https://www.cnblogs.com/chenglj/p/7372996.html backgrou ...

  6. 浅谈华为验厂对MES系统的要求

    众所周知,华为对供应商在管理.防错.品控.追溯等方面的要求都非常严格.在华为验厂时,对供应商的信息系统,尤其是MES系统的评估也是有非常具体的要求.那么我们今天就来谈谈华为验厂时,对MES系统有哪些具 ...

  7. Qt选择文件路径

    QString file_path = QFileDialog::getExistingDirectory(this, "请选择文件路径...", "./"); ...

  8. Redis的两种数据持久化方式比较

    RDB(Redis Database) 本质:基于时间点的快照 优点: 1.RDB格式文件体积小. 2.可以通过脚本执行bgsave(非阻塞)或者save(阻塞)命令自定义时间点进行备份. 3.可以保 ...

  9. Nginx应用优化

    案例环境: 系统类型 IP地址 主机名 所需软件 Centos 6.5 192.168.100.150 www.linuxfan.cn nginx-1.6.2.tar.gz 一.Nginx隐藏版本号 ...

  10. linux服务器NAT后无法在内网通过外部IP访问内部服务的问题

    场景一: 将外网访问192.168.100.10的80端口转发到192.168.75.5:8000端口. # iptables -t nat -A PREROUTING -d 192.168.100. ...