https://mp.weixin.qq.com/s/TSwKL_qm-b-0e8x7r--hhg

 
简单介绍Atomics中数学运算、逻辑运算的实现。
 
 
1. io
 
Atomics是一个硬件模块,他继承自Modules:
 
IO端口定义如下:
其中:
a. write: 是否写操作;
b. a:输入操作类型及一个操作数;
c. data_in:输入另一个操作数;
d. data_out:输出计算结果;
 
2. Arithmetic params
 
处理channel a传入的params:
 
Channel A上的ArithmeticData消息的params定义如下:
对应代码,可以看到params各比特的意义:
a. io.a.params(2):如果这一位为1,则表明运算为加法运算;
b. io.a.params(1):如果这一位为1,则表明为无符号运算;
c. io.a.params(0):如果这一位为1,则表明为取最大值运算;如果为0,则为取最小值运算;
 
3. Arithmetic
 
数学运算逻辑的实现如下:
 
1) signBit
 
io.a.mask中的每一位对应着io.a.data中的一个字节。mask中为0的位对应的字节无效,不参与运算。mask中为1的位对应的字节才可以参与运算。那么io.a.data的符号,则由io.a.mask中最高的值为1的位对应的字节决定。
 
signBit的意义即为取出mask中最高的一个为1的位。只有mask中最高的值为1的位对应的比特值为1,其余比特的值都为0。这样可以作为掩码选出io.a.data中决定符号的字节。
 
这个左移一位相与的实现,有一个隐含条件:mask中值为1的比特要连续。
 
这一点由规范中对io.a.mask的要求来满足:
 
2) inv_d
 
如果是加法,则直接使用原值即可。如果是减法,则需要取反加一。
 
3) sum
 
相加:
a. 把io.a.mask中的每一位扩展为8位:FillInterleaved(8, io.a.mask)
b. 使用扩展之后的掩码去掩io.a.data,把无效的字节掩掉:FillInterleaved(8, io.a.mask) & io.a.data
c. 与inv_d相加: + inv_d
 
根据inv_d的取值,决定结果是和还是差:io.a.data - io.data_in = io.a.data + ~io.data_in + 1。
所以如果sum是差值,那么还需要加1才是真正的差值。
 
4) sign
 
计算输入参数的符号:
a. 输入参数x是一个UInt;
b. 取出x中每一个字节的最高位:x.toBools().grouped(8).map(_.last).toList;
c. 把最高位组成一个UInt;
d. 取出最高有效字节的最高位:& signBit;
e. 以Bool类型输出最高位:.orR();
 
5) pick_a
 
如果运算是比较大小的话,是选择第一个参与比较的数字a,还是选择比较对象d:
如果选择较大的数,而a大于d则选择a;
 
6) a_bigger
 
a是不是比d大:
 
a. 如果a和d的符号不同,则取决于a_bigger_uneq的值,这个下面介绍。
 
b. 如果a和d的符号相同,则取决于两者之差的符号,即取决于sum的符号,及sign_s的值。
 
这里的一个小trick是sum并不是真正的差值,而是差值减了1的值。即:
 
sign_s是sum的符号,sign_s == 0等价于sum >= 0:
a - d >= 1的情况下,a一定大于d,不包括a == d的情况。
 
这里利用了a == d的情况下,取a或者d都是一样的,来规避求差值需要减1的逻辑消耗。
 
7) a_bigger_uneq
 
这个名字中的uneq意思就是a和d的符号不同:
A. 如果unsigned == 1:
a. 如果sign_a == 1,那么sign_d == 0,a更大,a_bigger_uneq == 1;
b. 如果sign_a == 0,那么sign_d == 0,a更小,a_bigger_uneq == 0;
 
B. 如果unsigned == 0:
a. 如果sign_a == 1为负数,那么sign_d == 0为正数,a更小,a_bigger_uneq == 0;
b. 如果sign_a == 0为正数,那么sign_d == 0为负数,a更大,a_bigger_uneq == 1;
 
可以看到a_bigger_uneq可以很好的表示两个数值的大小。
 
4. Logical
 
Logical的计算比较简单,把第一个参数和第二个参数相应的位组合在一起,总共有四种情况,组成序号0/1/2/3,根据这个序号去查表即可得到逻辑运算的结果:
 
5. 运算结果输出
 
可能输出的有四个值:0=d, 1=a, 2=sum, 3=logical
 
根据每一种操作(io.a.opcode决定)所需要值确定一个序号,然后再使用这个序号从序列中取值即可:
这里根据io.a.mask,逐个字节取值。无效字节使用io.data_in中的值。

Rocket - tilelink - Atomics的更多相关文章

  1. Rocket - tilelink - RegisterRouter

    https://mp.weixin.qq.com/s/DaJhf7hEoWsEi_AjwSrOfA   简单介绍RegisterRouter的实现.   ​​   1. 基本介绍   实现挂在Tile ...

  2. Rocket - tilelink - RAMModel

    https://mp.weixin.qq.com/s/9ccDTm6HytvfGN5R2CPoAQ   简单介绍RAMModel的实现.   ​​   1. 基本介绍   RAMModel用于定义内存 ...

  3. Rocket - tilelink - AtomicAutomata

    https://mp.weixin.qq.com/s/O7VTHqpCFNJQi3EpucXkIw   简单介绍AtomicAutomata的实现.(细节问题太多,恕不完全表述.)   ​​   1. ...

  4. Rocket - tilelink - Nodes

    https://mp.weixin.qq.com/s/KJ8pVH76rdxPOZ1vE3QlKA   简单介绍tilelink对Diplomacy Nodes的实现.   ​​   1. TLImp ...

  5. Rocket - tilelink - AsyncCrossing

    https://mp.weixin.qq.com/s/v8plWCBD8vZkxykjJe4TCg   介绍AsyncCrossing的实现,主要介绍如何实现diplomacy Node和LazyMo ...

  6. Rocket - tilelink - mask

    https://mp.weixin.qq.com/s/Gqv09RIgSSg5VKe-wb4aGg   讨论tilelink中使用MaskGen生成mask的用法.   1. tilelink中的ma ...

  7. Rocket - tilelink - Parameters

    https://mp.weixin.qq.com/s/1I6DcONr0Mg7xiX8F1C7SQ   简单介绍TileLink相关的参数实现(具体问题暂时不展开,后续用到时再做分析).   ​​   ...

  8. Rocket - tilelink - Bundles

    https://mp.weixin.qq.com/s/jrqBg2AIpQogBrpwNXjmwg   简单介绍Bundles文件中对TileLink规范(1.7.1)的定义. 参考链接:https: ...

  9. Rocket - tilelink - TLBusWrapper.to

    https://mp.weixin.qq.com/s/jSnhBzU5_ayQCg5fWAcx-g 简单介绍TLBusWrapper.to()的实现.主要介绍确定this{...}对应代码的过程. 1 ...

随机推荐

  1. Go语言入门教程系列——函数、循环与分支

    本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是Golang专题的第四篇,这一篇文章将会介绍golang当中的函数.循环以及选择判断的具体用法. 函数 在之前的文章当中其实我们已经接 ...

  2. 基于胜率矩阵的PageRank排序

      在做博弈模型评估的时候,遇到一个问题是如何评价多个模型的优劣.例如我有训练好的三个围棋模型A,B,C,两两之间对打之后有一个胜负关系,如何对这三个模型进行排序呢?通常对于人类选手这种水平有波动的情 ...

  3. 解密C语言编译背后的过程

    我们大部分程序员可能都是从C语言学起的,写过几万行.几十万行.甚至上百万行的代码,但是大家是否都清楚C语言编译的完整过程呢,如果不清楚的话,我今天就带着大家一起来做个解密吧. C语言相对于汇编语言是一 ...

  4. QTableWidget自定义委托

    QTableWidget单元格使用自定义的lineEdit控件导致不能选中 使用自定义委托解决 1.自定义委托 class LineEditDelegate : public QItemDelegat ...

  5. HDU-6030 Happy Necklace 打表+矩阵快速幂

    Happy Necklace 前天个人赛规律都找出来了,n的范围是\(10^{18}\),我一想GG,肯定是矩阵快速幂,然后就放弃了. 昨天学了一下矩阵快速幂. 题意 现在小Q要为他的女朋友一个有n个 ...

  6. android学习流程确立

    也是摘抄自网上,先打个基础吧,以后有更新,再更改. 确定学习路线:向着中级工程师奋斗Android入门的时候,需要有一本入门书,好好学习书中的内容,同时花一年时间把Android官方文档中的train ...

  7. 00001- layui 表格的默认工具栏添加自定义按钮

    首先定义table: var tableIns = table.render({ elem:'#businessUserListTable' ,url: ctx+'/business/business ...

  8. centos6下filebeat多开问题

    centos6下filebeat多开问题 0. 场景 比如之前在用filebeat做收集,但是想新开一个实例把之前的日志全部重新导一遍,如果直接指定filebeat -c 是不行的,因为filebea ...

  9. .Net数据集导出到Excel样式细节---------------摘自别人的

    .Net数据集导出到Excel样式细节 本文的目的是总结一些在做Excel导出功能时需要注意的样式细节.使用环境是Asp.Net,数据集的形式是Html Table,Excel还是识别一些CSS代码的 ...

  10. Oracle备份与恢复详解

    http://www.360doc.com/content/10/1015/15/3267996_61218717.shtml --------摘自 360doc 为了能有效地备份和恢复数据库,建议大 ...