[转帖]AMD处理器ZEN一代之国产化海光

https://huataihuang.gitbook.io/cloud-atlas-draft/os/linux/kernel/cpu/amd_hygon

2020年国产化处理器受到了广泛的关注(中美贸易战)，中科海光(Hygon)是国内维二具备生产X86处理器的中国公司，其产品具有一定代表性：

2016年中科海光(国天津海光先进技术投资有限公司（THATIC）)向AMD购买了x86 和 SoC IP 技术授权

美国政府为英特尔、AMD 等公司生产的处理器进行了价值标定，一旦其算力（FLOPS）和功耗的比值过高就会被认为是「性能过强」而被限制出口。

2015 年，AMD 就已向美国国防部、商务部等机构进行了申请，并获得了向中国提供技术转让的许可。

2019 年，美国商务部将海光加入了实体清单，这意味着 AMD 难以继续向合资企业授予任何其他 IP 许可。

目前海光能够使用的是2016年已经获得的原始IP（AMD 14nm Zen架构），而不是完整的技术转让（加密技术相关技术被阉割，浮点性能削弱），底层设计和技术、专利依然属于AMD，海光只能在高级层面根据自己的需要进行修改、定制。

Hygon服务器CPU

Hygon服务器CPU是32核处理器，现代处理器都支持超线程，通过超线程技术(x2)，相当于 64 HT 处理器。在服务器上采用双处理器SMP系统，则可以在服务器上通过 cat /proc/cpuinfo 看到 128 HT (32x2x2)。

CPU缓存
L1缓存
64KB四路 L1指令缓存
32KB八路 L1数据缓存
L2缓存
512KB八路 L2缓存
L3缓存
8MB十六路 L3缓存

加密
海光CPU 被去除了 AMD原始的Zen一代处理器使用AMD虚拟化功能(SEV)的安全加密：RSA, ECDSA, ECDH, SHA 和 AES
海光Dhyana处理器SEV被改成使用 SM2, SM3 和 SM4 算法(国密算法)

SM2是椭圆曲线公钥密码算法，相比于RSA更先进、更节能、更安全，国家密码管理局2010年12月17日发布。

SM3是哈希算法，属于密码散列函数标准，用于数字签名及验证、消息认证码生成及验证、随机数生成等，原理、安全性和效率都类似SHA-256，国家密码管理局2010年12月17日发布。

SM4是分组密码算法，用于数据加密，分组和秘钥长度都是128位，类似AES-128，国家密码管理局2012年3月21日发布。

海光获得架构的整数性能基本没变，但是浮点性能损失很大:
DIV、SQRT等浮点指令直接消失
大量的MMX/SSE简单指令则被降速

随机数生成器

早期海光CPU版本 /dev/urandom 性能较低，原因是RDSEED（用于生成随机数算法的种子生成）真随机数发生器产生种子速度不够强或质量还不足，小概率被撞上了产生了延迟。后期二代产品真随机数发生器由1个增加到3个，同时被撞上的概率接近0，就不存在这样的问题了。

参见中科海光CPU的首次评测：基于AMD架构，覆盖桌面服务器端提到了Hygon Dhyana（桌面版本） RDSEED 比 Hygon Dhyna Plus（服务器版本)要慢10倍。

不过海光RDRAND算法比原先AMD Zen版本快

测试服务器 /dev/urandam 设备性能:

head -c 1M /dev/urandom > /tmp/out

如果出现比较明显的延迟，则可能和上述 RDSEED 性能相关，有一定概率会导致操作系统加密相关应用异常(例如sshd服务)。可以考虑在BIOS设置 CBS-Moksha Common Options > RDSEED and RDRAND Control 配置成 disable (默认是 auto) ，这样操作系统会调用软随机数发生器来规避这个问题。

功能缺失

据中科海光CPU的首次评测：基于AMD架构，覆盖桌面服务器端说明，虽然海光CPU标记了 AVX 和 AVX2 功能，但实际被禁用，导致相关测试无法通过。此外 AESNI、SHA、CLMUL、FMA4、BMI、BMI2等指令也无法运行。

上述指令和加密编码相关，导致海光CPU（32核心双处理器配置）的AES编码甚至不如入门级4核心锐龙3 1200

性能结论

海光CPU在AMD Zen 1基础上做了大量修改，例如加密功能做了替换。但是整体性能比同代原版CPU略差：
整数性能基本相同，浮点性能显著下降(普通指令吞吐量只有原先1/2)
随机数生成机制已经修改，加密引擎被替换
不能对常见对AES指令加速(不支持AVX和AVX2功能)，但是增加了国蜜要求指令 SM2, SM3 和SM$

海光CPU基于AMD Zen1定制，由于合作协议只限于Zen 1而不是大获成功的Zen 2，所以技术上有诸多不足：例如Zen 2支持L3缓存PQoS(对标Intel RDT技术)就无法获得，这在数据中性混布计算中有非常大的局限性

根据 Winichip资料： Zen - Microarchitectures - AMD ：
Linux从 Kernel 4.10才开始支持Zen架构，所以要能够正常工作，一定要选择 Kernel 4.10 以后版本，建议参考主流发行版本 CentOS 8以及 Ubuntu 20.04 LTS内核版本

参考

中科海光CPU的首次评测：基于AMD架构，覆盖桌面服务器端

Zen架构！国产海光x86 CPU实测：虽有缩水意义非凡

中国两大X86 CPU：海光和兆芯 - 有关国产化X86服务器的背景信息(海光和AMD合作)

Winichip资料： Zen - Microarchitectures - AMD - 如果要详细研究Zen架构，这个技术文档是很好的起点，汇总了大量架构信息

[转帖]AMD处理器ZEN一代之国产化海光的更多相关文章

[转帖]AMD：Zen 2霄龙处理器每美元性能可达英特尔至强5.6倍
AMD:Zen 2霄龙处理器每美元性能可达英特尔至强5.6倍 2019-10-20 6:35:38来源:IT之家作者:孤城责编:孤城评论:32 https://www.ithome.com/0/451 ...
[转帖]AMD Zen霄龙中国版：海光x86拿下加解密全球第一
AMD Zen霄龙中国版:海光x86拿下加解密全球第一 http://www.eetop.cn/cpu_soc/6946203.html 其实技术发展都是先模仿剽窃再自我创新的要加以鼓励总比 ...
Intel SP处理机以及AMD处理器的一些对比资料
1. EPYC 与 intel的CPU对比 2. Intel SP处理器参数: 3. AMD处理器参数 4. Intel SP处理器部分参数2 5. Intel SP处理器简单说明 6. intel ...
[转帖]AIDA64 6.10版发布：全面支持中国兆芯、海光x86 CPU
AIDA64 6.10版发布:全面支持中国兆芯.海光x86 CPU https://www.cnbeta.com/articles/soft/892877.htm 支持国产x86了作为硬件识别工具领 ...
[转帖]AMD、英特尔为何争相走向胶水多核处理器？真相在此
AMD.英特尔为何争相走向胶水多核处理器?真相在此胶水多核到底好不好?这个事不是简单一句话能说明的,今天的超能课堂里我们就来聊聊MCM胶水多核技术的过去及未来. 作者:孟宪瑞来源:超能网|2018- ...
[转帖]AMD第三代锐龙处理器首发评测：i9已无力招架
AMD第三代锐龙处理器首发评测:i9已无力招架 Intel 从之前的 CCX 到了 CCD 增加了缓存改善了 ccx 之间的延迟. https://baijiahao.baidu.com/s?id= ...
【转帖】处理器史话 | 服务器CPU市场的战役， AMD、Intel和ARM的厮杀
处理器史话 | 服务器CPU市场的战役, AMD.Intel和ARM的厮杀 https://www.eefocus.com/mcu-dsp/377300 说完了个性鲜明的消费类电子,接下来聊一聊通 ...
【转帖】处理器史话 | 这张漫画告诉你，为什么双核CPU能打败四核CPU？
处理器史话 | 这张漫画告诉你,为什么双核CPU能打败四核CPU? https://www.eefocus.com/mcu-dsp/371324 2016-10-28 10:28 作者:付丽华预计 9 ...
[转帖]AMD三代锐龙线程撕裂者命名曝光：24核心3960X
AMD三代锐龙线程撕裂者命名曝光:24核心3960X https://www.cnbeta.com/articles/tech/900271.htm 一直搞不懂TDP啥意思可能会高于TDP的功率.. ...
[转帖]AMD霄龙安全加密虚拟化曝漏洞：已修复
AMD霄龙安全加密虚拟化曝漏洞:已修复 https://www.cnbeta.com/articles/tech/862611.htm 硬件的安全问题今年初,Google的一位研究人员发现,AMD ...

随机推荐

Blazor快速开发框架Known-V2.0.0
Known2.0 Known是基于Blazor的企业级快速开发框架,低代码,跨平台,开箱即用,一处代码,多处运行. 官网:http://known.pumantech.com Gitee: https ...
flutter中显示年月日、星期与时间
代码 import 'package:flutter/material.dart'; import 'package:intl/intl.dart'; import 'dart:async'; imp ...
Spring系列：基于Spring-Jdbc实现事务
目录一.事务基本概念二.编程式事务三.声明式事务前期准备四.基于注解的声明式事务 @Transactional注解标识的位置事务属性:只读事务属性:超时事务属性:回滚策略事务属性:隔 ...
第十一部分_Shell脚本之正则表达式
正则表达式 1. 正则表达式是什么? 正则表达式(Regular Expression.regex或regexp,缩写为RE),也译为正规表示法.常规表示法,是一种字符模式,用于在查找过程中匹配指定的 ...
技术实践丨基于MindSpore的ResNet-50蘑菇“君”的识别应用体验
本文分享自华为云社区<基于MindSpore的ResNet-50蘑菇"君"的识别应用体验>,原文作者:Dasming. 摘要:基于华为MindSpore框架的ResNe ...
实时媒体AI，打破内容创作天花板，加速视频创新
摘要:互联网视频经过几代发展,用户体验快速升级,对创新玩法.互动性要求越来越高.那如何解决这些问题? 媒体AI,是行业共识.华为云提供云原生实时媒体AI能力,联合伙伴打造AI算法开放生态市场,加速视频 ...
VEGA：诺亚AutoML高性能开源算法集简介
摘要:VEGA是华为诺亚方舟实验室自研的全流程AutoML算法集合,提供架构搜索.超参优化.数据增强.模型压缩等全流程机器学习自动化基础能力. 本文分享自华为云社区<VEGA:诺亚AutoML高 ...
AI贺新年，开发者的虎年这样过才有意思
摘要:祝所有的开发者们新春快乐,万事如意迎新年,如虎添翼旺全年! 普通人拜年,发一个祝福微信.程序员拜年,运行一串代码,制作独一无二的拜年短视频. 普通人送祝福,新年快乐.程序员送祝福,信手捏来一首拜 ...
华山论“件”：Kafka、RabbitMQ、RocketMQ技能大比拼
摘要:主流的消息中间件包含Kafka.RabbitMQ和RocketMQ,本期云图说为您介绍它们之前的差异. 本文分享自华为云社区<第234期华山论"件"-Kafka.Ra ...
vue2升级vue3：class component的遗憾
在vue2,class 写法真的非常爽 import { Component as tsc } from 'vue-tsx-support'; import { Component, Watch } ...

[转帖]AMD处理器ZEN一代之国产化海光

[转帖]AMD处理器ZEN一代之国产化海光的更多相关文章

随机推荐

热门专题