[转帖]AMD处理器ZEN一代之国产化海光
https://huataihuang.gitbook.io/cloud-atlas-draft/os/linux/kernel/cpu/amd_hygon
- 2016年中科海光(国天津海光先进技术投资有限公司(THATIC))向AMD购买了x86 和 SoC IP 技术授权
美国政府为英特尔、AMD 等公司生产的处理器进行了价值标定,一旦其算力(FLOPS)和功耗的比值过高就会被认为是「性能过强」而被限制出口。2015 年,AMD 就已向美国国防部、商务部等机构进行了申请,并获得了向中国提供技术转让的许可。2019 年,美国商务部将海光加入了实体清单,这意味着 AMD 难以继续向合资企业授予任何其他 IP 许可。
cat /proc/cpuinfo 看到 128 HT (32x2x2)。- CPU缓存
- L1缓存
- 64KB四路 L1指令缓存
- 32KB八路 L1数据缓存
- L2缓存
- 512KB八路 L2缓存
- L3缓存
- 8MB十六路 L3缓存
- 加密
- 海光CPU 被去除 了 AMD原始的Zen一代处理器使用AMD虚拟化功能(SEV)的安全加密:RSA, ECDSA, ECDH, SHA 和 AES
- 海光Dhyana处理器SEV被改成使用 SM2, SM3 和 SM4 算法(国密算法)
SM2是椭圆曲线公钥密码算法,相比于RSA更先进、更节能、更安全,国家密码管理局2010年12月17日发布。
SM3是哈希算法,属于密码散列函数标准,用于数字签名及验证、消息认证码生成及验证、随机数生成等,原理、安全性和效率都类似SHA-256,国家密码管理局2010年12月17日发布。
SM4是分组密码算法,用于数据加密,分组和秘钥长度都是128位,类似AES-128,国家密码管理局2012年3月21日发布。
- 海光获得架构的整数性能基本没变,但是浮点性能损失很大:
- DIV、SQRT等浮点指令直接消失
- 大量的MMX/SSE简单指令则被降速
/dev/urandom 性能较低,原因是RDSEED(用于生成随机数算法的种子生成)真随机数发生器产生种子速度不够强或质量还不足,小概率被撞上了产生了延迟。后期二代产品真随机数发生器由1个增加到3个,同时被撞上的概率接近0,就不存在这样的问题了。参见 中科海光CPU的首次评测:基于AMD架构,覆盖桌面服务器端 提到了Hygon Dhyana(桌面版本)RDSEED比 Hygon Dhyna Plus(服务器版本)要慢10倍。不过海光RDRAND算法比原先AMD Zen版本快
/dev/urandam 设备性能:RDSEED 性能相关,有一定概率会导致操作系统加密相关应用异常(例如sshd服务)。可以考虑在BIOS设置 CBS-Moksha Common Options > RDSEED and RDRAND Control 配置成 disable (默认是 auto) ,这样操作系统会调用软随机数发生器来规避这个问题。- 海光CPU在AMD Zen 1基础上做了大量修改,例如加密功能做了替换。但是整体性能比同代原版CPU略差:
- 整数性能基本相同,浮点性能显著下降(普通指令吞吐量只有原先1/2)
- 随机数生成机制已经修改,加密引擎被替换
- 不能对常见对AES指令加速(不支持AVX和AVX2功能),但是增加了国蜜要求指令 SM2, SM3 和SM$
- 海光CPU基于AMD Zen1定制,由于合作协议只限于Zen 1而不是大获成功的Zen 2,所以技术上有诸多不足:例如Zen 2支持L3缓存PQoS(对标Intel RDT技术)就无法获得,这在数据中性混布计算中有非常大的局限性
- Linux从 Kernel 4.10才开始支持Zen架构,所以要能够正常工作,一定要选择 Kernel 4.10 以后版本,建议参考主流发行版本 CentOS 8以及 Ubuntu 20.04 LTS内核版本
- 中国两大X86 CPU:海光和兆芯 - 有关国产化X86服务器的背景信息(海光和AMD合作)
- Winichip资料: Zen - Microarchitectures - AMD - 如果要详细研究Zen架构,这个技术文档是很好的起点,汇总了大量架构信息
[转帖]AMD处理器ZEN一代之国产化海光的更多相关文章
- [转帖]AMD:Zen 2霄龙处理器每美元性能可达英特尔至强5.6倍
AMD:Zen 2霄龙处理器每美元性能可达英特尔至强5.6倍 2019-10-20 6:35:38来源:IT之家作者:孤城责编:孤城评论:32 https://www.ithome.com/0/451 ...
- [转帖]AMD Zen霄龙中国版:海光x86拿下加解密全球第一
AMD Zen霄龙中国版:海光x86拿下加解密全球第一 http://www.eetop.cn/cpu_soc/6946203.html 其实技术发展都是先模仿 剽窃 再自我创新的 要加以鼓励 总比 ...
- Intel SP处理机以及AMD处理器的一些对比资料
1. EPYC 与 intel的CPU对比 2. Intel SP处理器参数: 3. AMD处理器参数 4. Intel SP处理器部分参数2 5. Intel SP处理器简单说明 6. intel ...
- [转帖]AIDA64 6.10版发布:全面支持中国兆芯、海光x86 CPU
AIDA64 6.10版发布:全面支持中国兆芯.海光x86 CPU https://www.cnbeta.com/articles/soft/892877.htm 支持国产x86了 作为硬件识别工具领 ...
- [转帖]AMD、英特尔为何争相走向胶水多核处理器?真相在此
AMD.英特尔为何争相走向胶水多核处理器?真相在此 胶水多核到底好不好?这个事不是简单一句话能说明的,今天的超能课堂里我们就来聊聊MCM胶水多核技术的过去及未来. 作者:孟宪瑞来源:超能网|2018- ...
- [转帖]AMD第三代锐龙处理器首发评测:i9已无力招架
AMD第三代锐龙处理器首发评测:i9已无力招架 Intel 从之前的 CCX 到了 CCD 增加了缓存 改善了 ccx 之间的延迟. https://baijiahao.baidu.com/s?id= ...
- 【转帖】处理器史话 | 服务器CPU市场的战役, AMD、Intel和ARM的厮杀
处理器史话 | 服务器CPU市场的战役, AMD.Intel和ARM的厮杀 https://www.eefocus.com/mcu-dsp/377300 说完了个性鲜明的消费类电子,接下来聊一聊通 ...
- 【转帖】处理器史话 | 这张漫画告诉你,为什么双核CPU能打败四核CPU?
处理器史话 | 这张漫画告诉你,为什么双核CPU能打败四核CPU? https://www.eefocus.com/mcu-dsp/371324 2016-10-28 10:28 作者:付丽华预计 9 ...
- [转帖]AMD三代锐龙线程撕裂者命名曝光:24核心3960X
AMD三代锐龙线程撕裂者命名曝光:24核心3960X https://www.cnbeta.com/articles/tech/900271.htm 一直搞不懂TDP啥意思 可能会高于TDP的功率.. ...
- [转帖]AMD霄龙安全加密虚拟化曝漏洞:已修复
AMD霄龙安全加密虚拟化曝漏洞:已修复 https://www.cnbeta.com/articles/tech/862611.htm 硬件的安全问题 今年初,Google的一位研究人员发现,AMD ...
随机推荐
- Blazor快速开发框架Known-V2.0.0
Known2.0 Known是基于Blazor的企业级快速开发框架,低代码,跨平台,开箱即用,一处代码,多处运行. 官网:http://known.pumantech.com Gitee: https ...
- flutter中显示年月日、星期与时间
代码 import 'package:flutter/material.dart'; import 'package:intl/intl.dart'; import 'dart:async'; imp ...
- Spring系列:基于Spring-Jdbc实现事务
目录 一.事务基本概念 二.编程式事务 三.声明式事务 前期准备 四.基于注解的声明式事务 @Transactional注解标识的位置 事务属性:只读 事务属性:超时 事务属性:回滚策略 事务属性:隔 ...
- 第十一部分_Shell脚本之正则表达式
正则表达式 1. 正则表达式是什么? 正则表达式(Regular Expression.regex或regexp,缩写为RE),也译为正规表示法.常规表示法,是一种字符模式,用于在查找过程中匹配指定的 ...
- 技术实践丨基于MindSpore的ResNet-50蘑菇“君”的识别应用体验
本文分享自华为云社区<基于MindSpore的ResNet-50蘑菇"君"的识别应用体验>,原文作者:Dasming. 摘要:基于华为MindSpore框架的ResNe ...
- 实时媒体AI,打破内容创作天花板,加速视频创新
摘要:互联网视频经过几代发展,用户体验快速升级,对创新玩法.互动性要求越来越高.那如何解决这些问题? 媒体AI,是行业共识.华为云提供云原生实时媒体AI能力,联合伙伴打造AI算法开放生态市场,加速视频 ...
- VEGA:诺亚AutoML高性能开源算法集简介
摘要:VEGA是华为诺亚方舟实验室自研的全流程AutoML算法集合,提供架构搜索.超参优化.数据增强.模型压缩等全流程机器学习自动化基础能力. 本文分享自华为云社区<VEGA:诺亚AutoML高 ...
- AI贺新年,开发者的虎年这样过才有意思
摘要:祝所有的开发者们新春快乐,万事如意迎新年,如虎添翼旺全年! 普通人拜年,发一个祝福微信.程序员拜年,运行一串代码,制作独一无二的拜年短视频. 普通人送祝福,新年快乐.程序员送祝福,信手捏来一首拜 ...
- 华山论“件”:Kafka、RabbitMQ、RocketMQ技能大比拼
摘要:主流的消息中间件包含Kafka.RabbitMQ和RocketMQ,本期云图说为您介绍它们之前的差异. 本文分享自华为云社区<第234期 华山论"件"-Kafka.Ra ...
- vue2升级vue3:class component的遗憾
在vue2,class 写法真的非常爽 import { Component as tsc } from 'vue-tsx-support'; import { Component, Watch } ...