主存到Cache直接映射、全相联映射和组相联映射

转自:https://blog.csdn.net/dongyanxia1000/article/details/53392315

---- Cache的容量很小，它保存的内容只是主存内容的一个子集，且Cache与主存的数据交换是以块（cache line）为单位的。为了把信息放到Cache中，必须应用某种函数把主存地址定位到Cache中，这称为地址映射。

---- 在信息按这种映射关系装入Cache后，CPU执行程序时，会将程序中的主存地址变换成Cache地址，这个变换过程叫做地址变换。

Cache的地址映射方式有直接映射、全相联映射和组相联映射。

假设某台计算机主存容量为1MB，被分为2048块，每个Block为512B；Cache容量为8KB，被分为16块，每块也是512B。

下面以此为例介绍三种基本的地址映射方法。

1. 直接映射

---- 一个内存地址能被映射到的Cache line是固定的。就如每个人的停车位是固定分配好的，可以直接找到。缺点是：因为人多车位少，很可能几个人争用同一个车位，导致Cache淘汰换出频繁，需要频繁的从主存读取数据到Cache，这个代价也较高。

直接映射的Cache组织如图（1）所示。主存中的一个块只能映射到Cache的某一特定块中去。例如，

主存的第0块、第16块、第32块、第48块、……、第2032块等128块，只能映射到Cache的第0块；

主存的第1块、第17块、第33块、第49块、……、第2033块等128块，只能映射到Cache的第1块；

以此类推，主存的第15块、第31块、第47块、……、第2047块等128块，只能映射到Cache的第15块中。

映射完毕，Cache总共有0～15即16块，主存中的每128（2048/16）块，只能映射到Cache中的某一个块中。

即映射规则为cache line index = （主存（Page）的line数）%（cache中 cache line的总数）

主存的line数是0～2047，cache中cache line的总数是16.

图（1）

直接映射是最简单的地址映射方式，它的硬件简单，成本低，地址变换速度快，而且不涉及替换算法问题。但是这种方式不够灵活，Cache的存储空间得不到充分利用，每个主存块只有一个固定位置可存放，容易产生冲突，使Cache效率下降，因此只适合大容量Cache采用。例如，如果一个程序需要重复引用主存中第0块与第16块，最好将主存第0块与第16块同时复制到Cache中，但由于它们都只能复制到Cache的第0块中去，即使Cache中别的存储空间空着也不能占用，因此这两个块会不断地交替装入Cache中，导致命中率降低。

2. 全相联映射

---- 主存中的一个地址可被映射进任意cache line，问题是：当寻找一个地址是否已经被cache时，需要遍历每一个cache line来寻找，这个代价很高。就像停车位可以大家随便停一样，停的时候简单，找车的时候需要一个一个停车位的找了。

图（2）是全相联映射的Cache组织，主存中任何一块都可以映射到Cache中的任何一块位置上。

图（2）

全相联映射方式比较灵活，主存的各块可以映射到Cache的任一块中，Cache的利用率高，块冲突概率低，只要淘汰Cache中的某一块，即可调入主存的任一块。但是，由于Cache比较电路的设计和实现比较困难，这种方式只适合于小容量Cache采用。

3. 组相联映射

---- 组相联映射实际上是直接映射和全相联映射的折中方案，其组织结构如图（3）所示。

主存和Cache都分组，主存中一个组内的块数与Cache中的分组数相同，组间采用直接映射，组内采用全相联映射。也就是说，将Cache分成2^u组，每组包含2^v块，主存块存放到哪个组是固定的，至于存到该组哪一块则是灵活的。即主存的某块只能映射到Cache的特定组中的任意一块。主存的某块b与Cache的组k之间满足以下关系：k=b%(2^u).

例如，Cache分为8组(u=3)，每组2块(v=1)，主存分为128个区，每个区16块。

图（3）

主存中的各块与Cache的组号之间有固定的映射关系，但可自由映射到对应Cache组中的任何一块。例如：

--主存的第0块、第2^u块、第2×(2^u)块、…第255x(2^u)即255x8=2040块等256块均映射于Cache的第0组，但可映射到其中的第0块或第1块；

--主存的第1块、第2^u+1块、第3^(2^u)+1块、…第255x(2^u+1)即2041块等均映射于Cache的第2组，但可映射到Cache第2组中的任意一块；

--主存的第2块、第2^u+2块、第（2^u）x2+2块、…第2042块等均映射于Cache的第3组，但可映射到Cache第3组中的任意一块；

--主存的第7块、第2^u+7块、第2^(u+1)+7块、…第2047块等均映射于Cache的第8组，但可映射到Cache第8组中的第14块或第15块。

常采用的组相联结构Cache，每组内有2、4、8、16块，称为2路、4路、8路、16路组相联Cache。以上为2路组相联Cache。组相联结构Cache是前两种方法的折中方案，适度兼顾二者的优点，尽量避免二者的缺点，因而得到普遍采用。

实例分析：

1.容量为64块的Cache采用组相联方式映像，字块大小为128字节，每4块为一组，若主容量为4096块，且以字编址，那么主存地址为（19）位，主存区号为（6）位。

解：组相联的地址构成为：区号+组号+块号+块内地址。

主存的每个分区/组大小与整个Cache大小相等，故此主存需要分的区数为：4096/64=64，因为2⁶＝64，因此需要6位来表示区号。每4块为一组，故共有组数 64/4 = 16 ，因为2⁴＝16，因此需要4位表示组号。每组4块，故表示块号需要2位。

块内地址共128字节，2⁷＝128，所以块内地需要7位表示。所以：主存地址的位数＝6+4+2+7 ＝ 19

主存区号的位数＝6

个人见解：Cache有u组，每组有v块，即u = 16，v = 4，Cache大小：64块×128B = 8KB。

主存大小：4096×128B = 2^12*2^7 = 2^19,即主存地址有19位。4096/64= 2^6主存区号为6位。

2.某 32 位计算机的 cache 容量为 16KB，cache 块的大小为 16B，若主存与 cache 的地址映射采用直接映射方式，则主存地址为 1234E8F8（十六进制）的单元装入的 cache 地址为__C__。

A. 00 0100 0100 1101 (二进制)
B. 01 0010 0011 0100 (二进制)
C. 10 1000 1111 1000 (二进制)
D. 11 0100 1110 1000 (二进制)

解：Cache大小为16KB，块大小为16B，所以Cache被分成16KB/16B=1024块，因2¹⁰＝1024故需要10位来表示块数。

2⁴＝16故块内地址需要4位来表示。所以Cache的地址线位置为14位。

由于采用直接映像的方式，所以主存的后14位就是要装入的到Cache中的位置。故选 C.

个人见解：Cache的容量是16KB = 16×1024B = 16384B，主存的地址为0x1234E8F8/（16×1024B）= 18643. 该地址对应的是主存的第18643块。

根据公式：cache的块地址i = 主存的块地址 % 16384 = 1234E8F8 - 1234C000 = 0x28F8 选C

主存到Cache直接映射、全相联映射和组相联映射的更多相关文章

cache与MMU与总线仲裁
为了以合理的价格,设计容量和速度满足计算机系统的需求,计算机体系结构设计者设计出了存储器的层次结构. "Cache-主存"和"主存-辅存"是最常见的两种层次结构 ...
Cache地址映射
原理:程序访问局部性在较短时间内由程序产生的地址往往集中在存储器逻辑地址空间的很小范围内时间:在一小段时间内,最近被访问过的程序和数据很可能再次被访问 ...
cache 浅析
http://blog.chinaunix.net/uid-26817832-id-3244916.html 1. Cache Cache一词来源于法语,其原意是"藏匿处,隐秘的地方&q ...
****** 三十四 ******、软设笔记【存储器系统】-Cache存储器
Cache存储器 Cache(高速缓冲存储器) 高速缓冲存储器是位于主存与CPU之间的一级存储器,有静态存储芯片(SRAM)组成,容量比较小,速度比主存高得多,接近于CPU的速度,单位成本比内存高.C ...
专题-主存储器与Cache的地址映射方式
2019/05/02 10:23 首先,我们注意到地址映射有三种:分别是直接地址映射.全相联映射.组相联映射. 首先我们搞清楚主存地址还有Cache地址的关系,还有组内地址的关系,常见我们的块内地址, ...
高速缓冲存储器Cache
目录概述问题的提出局部性原理命中与未命中 Cache的命中率 Cache-主存系统的效率例题工作原理地址映射方式(本节最重要) 直接映射全相联映射组相联映射例子替换策略例题写 ...
Cache一致性协议与伪共享问题
Cache一致性协议在说伪共享问题之前,有必要聊一聊什么是Cache一致性协议局部性原理时间局部性:如果一个信息项正在被访问,那么在近期它很可能还会被再次访问比如循环.方法的反复调用等空间局 ...
verilog简易实现CPU的Cache设计
verilog简易实现CPU的Cache设计该文是基于博主之前一篇博客http://www.cnblogs.com/wsine/p/4661147.html所增加的Cache,相同的内容就不重复写了 ...
solr中Cache综述
一.概述 Solr查询的核心类就是SolrIndexSearcher,每个core通常在同一时刻只由当前的SolrIndexSearcher供上层的handler使用(当切换SolrIndexSear ...

随机推荐

Java实现 LeetCode 61 旋转链表
61. 旋转链表给定一个链表,旋转链表,将链表每个节点向右移动 k 个位置,其中 k 是非负数. 示例 1: 输入: 1->2->3->4->5->NULL, k = ...
（四）SQLMap之Tamper篡改脚本的类型、作用、适用场景
目录结构一.SQLMap中tamper的简介 1.tamper的作用 2.tamper用法二.适配不同数据库类型的测试tamper 三.SQLMap中tamper篡改脚本的功能解释一.SQLMa ...
美女面试官问我Python如何优雅的创建临时文件，我的回答....
[摘要] 本故事纯属虚构,如有巧合,他们故事里的美女面试官也肯定没有我的美,请自行脑补... 小P像多数Python自学者一样,苦心钻研小半年,一朝出师投简历. 这不,一家招聘初级Python开发工程 ...
OO学习最终总结
0.前言:本次主要是针对第三阶段的三次作业以及整个课程学习的总结,这三次作业主要是针对对程序进行重构使得程序可以对功能进行扩展的训练以及对类的设计,所以在此阐述在练习过程中的问题以及感悟. 1.作业总 ...
el-table 表格加图片、加音频、加序号、多级动态表头
elemnet-ui组件库大家应该不陌生,在展示多条结构类似的数据方面,el-table可谓扛把子,不仅可以把数据展示的整齐,还支持排序.筛选或其他自定义操作.那么,除了上述的基本功能外,你还遇到过哪 ...
Logstash下字段以及嵌套Json字段类型转换
前言从filebeat传输到Logstash的数据,某个字段需要由string类型装换成float类型.但是不管怎么改logstash的配置文件都不生效,其实官方文档都有,但是具体细节方面的东西就得 ...
Redis PHP扩展安装步骤
### 下载最新的扩展文件,解压并进入文件夹 wget https://codeload.github.com/phpredis/phpredis/tar.gz/2.2.7 tar -zxvf 2.2 ...
css方法1（清除ul边距间隙，两端对齐，字母大写，首字放大）
一.清除ul自带左边间距 ul{ margin:; padding:; } 二.ul li 与li 之间隙 1.ul 设置font-size:0 ; 子li 设置字体大小 2.把li写到一起,不换行 ...
有趣的程序分析之C
1. 下面的函数被用来计算某个整数的平方,它能实现预期设计目标吗?如果不能,试回答存在什么问题: 1 2 3 4 int square( volatile int *ptr ) { retur ...
多语言工作者の十日冲刺<9/10>
这个作业属于哪个课程软件工程 (福州大学至诚学院 - 计算机工程系) 这个作业要求在哪里团队作业第五次--Alpha冲刺这个作业的目标团队进行Alpha冲刺--第九天(05.08) 作业正文 ...

主存到Cache直接映射、全相联映射和组相联映射

解：组相联的地址构成为：区号+组号+块号+块内地址。

主存到Cache直接映射、全相联映射和组相联映射的更多相关文章

随机推荐

热门专题