FPGA中的“门”

逻辑门
在ASIC的世界里,衡量器件容量的常用标准是等效门。这是因为不同的厂商在单元库里提供了不同的功能模块,而每个功能模块的实现都要求不同数量的晶体管。这样在两个器件之间比较容量和复杂度就很困难。
解决的办法是给 每个功能赋予一个等效门数值,就比如“A功能模块等价于5个等效门,B功能模块等价于3个等效门···”。下一步就是统计每个功能模块,把他们转换成相应的等效门值,把这些值相加,然后就可以自豪的公布:“我的ASIC包括一千万的等效门,这要比你的ASIC大多了!”
但是,事情没那么简单,不同的厂商对等效门实际结构的定义是不同的。通常情况下,一个2输入的NAND功能 表示一个等效门。也有一些厂商定义一个等效门等价于特定数目的晶体管。还有的厂商定义一个ECL等效门为“实现一个单比特全加器所要求最小逻辑的1/11”(这到底是谁想出来的?)。通常,最好的办法是,在投资之前先确定大家在谈论同样的事。
回到 FPGA来 ,FPGA厂商遇到一个问题,他们试图建立一个基础用于比较他们的器件和ASIC。例如,如果某人有一个现成的包含500000个等效门的ASIC设计,他想把这个设计变为用FPGA实现,他应该怎么样描述这个设计需要的FPGA呢?事实上每个4输入LUT都可以表示从1到20多个2输入基本逻辑门所能表示的任何功能,所以这样的比较相当微秒。
系统门
为了解决这个问题,FPGA厂商在20世纪90年代早期开始讨论系统门。有人说这是个代价高昂的想法,在ASIC设计中才会涉及这种专门术语。而另外一些人则说这纯粹是一个市场策略,没有任何人带来好处。
遗憾的是,似乎没有清晰的定义来解释什么是系统门。在FPGA实质上只包含LUT或寄存器形式的通用可编程逻辑资源时,这很令人尴尬。在那时甚至很难界定一个包含x个等效门的专门ASIC设计是否能够用一个包含y个系统门的FPGA来代替。这是因为有的ASIC设计者可能在组合逻辑方面具有优势,而另外一些则可能更偏重使用寄存器。这两种情况得到的结果可能不是一个在FPGA上的最优映射。
当FPGA开始包含嵌入式 RAM块时,问题变得尤为严重,因为有些功能使用RAM实现要比通用逻辑实现效率高。而且,事实上LUT可以当做分布式RAM来使用,例如有的厂商系统门计算值现在包括一个定语,“假设20%~30%的LUT是作为RAM来使用的”。当然,在开始认为FPGA包含嵌入式处理器核和类似功能时,这个问题更加严重了。于是,有的厂商现在说:“系统门数值没有计入这些元件”。
到底有没有简单的规则来把系统门转换成等效门呢?其实有很多。有的人认为如果你感觉乐观,你应当把系统门数值除以3(比如300万FPGA系统门应该等于100万ASIC等效门)。或者如果你感到更多的是悲观的那一面,你可以把系统门除以5(这样300万系统门将会等于60万等效门)。
然而也有人认为,只有在你假定系统门数值包括了所有能使用通用可编程逻辑和块RAM实现的功能时,以上规律才是正确的。这些人会接着说,如果你把RAM从等式中去掉,你就必须把系统门数值除以10(这时,300万系统门就只能等于30万等效门),但是这时你仍然可以使用块RAM。
最后,这个问题陷入这样一个泥潭,以至于连FPGA厂商都不愿意再谈论系统门。对于新出现在人们视野中的FPGA,人们很惬意的想象着等效门,而且方便用LUT、SLICE等考虑设计,然而,大量的FPGA设计者更习惯与用FPGA的名词。由于这个原因,有的人仍然保留了传统的习惯,我更愿意看到的是,我更愿意看到的是,使用以下简单的数目来规定和比较FPGA:
逻辑单元、逻辑元素或其他;
嵌入式块RAM数目;
嵌入式乘法器的数目;
嵌入式加法器的数目;
嵌入式MAC的数目;
其他。
为什么会这么困难?对一个真实世界里的ASIC设计实例进行全面的描述,给出它们的等效门,包括它们的寄存器/锁存器、原语门和其他更复杂的功能等细节,是很有用处的。这些设计实例在FPGA中实现所要求LUT和寄存器/锁存器的数量,还有嵌入式RAM和其他内嵌功能的数目就与此有关。
尽管现在还不理想,因为在FPGA和ASIC中人们的设计毕竟是不一样的,但是总会有一个开始。

版权所有权归卿萃科技 杭州FPGA事业部,转载请注明出处
作者:杭州卿萃科技ALIFPGA
原文地址:杭州卿萃科技FPGA极客空间 微信公众号

扫描二维码关注杭州卿萃科技FPGA极客空间
FPGA中的“门”的更多相关文章
- 【转】关于FPGA中建立时间和保持时间的探讨
时钟是整个电路最重要.最特殊的信号,系统内大部分器件的动作都是在时钟的跳变沿上进行, 这就要求时钟信号时延差要非常小, 否则就可能造成时序逻辑状态出错:因而明确FPGA设计中决定系统时钟的因素,尽 ...
- FPGA中竞争冒险问题的研究
什么是竞争冒险? 1 引言 现场可编程门阵列(FPGA)在结构上由逻辑功能块排列为阵列,并由可编程的内部连线连接这些功能块,来实现一定的逻辑功能. FPGA可以替代其他PLD或者各种中小规模数 ...
- FPGA中的delay与latency
delay和latency都有延迟的意义,在FPGA中二者又有具体的区别. latency出现在时序逻辑电路中,表示数据从输入到输出有效经过的时间,通常以时钟周期为单位. delay出现在组合逻辑电路 ...
- FPGA中的INOUT接口和高阻态
除了输入输出端口,FPGA中还有另一种端口叫做inout端口.如果需要进行全双工通信,是需要两条信道的,也就是说需要使用两个FPGA管脚和外部器件连接.但是,有时候半双工通信就能满足我们的要求,理论上 ...
- FPGA中的时序分析(四)
常用约束语句说明 关于Fmax 上述是实现Fmax的计算公式,clock skew delay的计算如下图, 就是两个时钟的差值.到头来,影响Fmax的值的大小就是组合逻辑,而Fmax是针对 ...
- FPGA中浮点运算实现方法——定标
有些FPGA中是不能直接对浮点数进行操作的,仅仅能採用定点数进行数值运算.对于FPGA而言,參与数学运算的书就是16位的整型数,但假设数学运算中出现小数怎么办呢?要知道,FPGA对小数是无能为力的,一 ...
- FPGA中改善时序性能的方法_advanced FPGA design
本文内容摘自<advanced FPGA design>对应中文版是 <高级FPGA设计,结构,实现,和优化>第一章中的内容 FPGA中改善时序,我相信也是大家最关心的话题之一 ...
- Altera FPGA中的pin进一步说明
最近END china上的大神阿昏豆发表了博文 <FPGA研发之道(25)-管脚>,刚好今天拿到了新书<深入理解Altera FPGA应用设计>第一章开篇就讲pin.这里就两者 ...
- QuartusII 中采用门级原语
QuartusII 中采用门级原语 默认的是前面第一个 为output 后面所有信号为输入 图中的工程实现的是 一个二选一多路选择器
随机推荐
- Oracle闪回机制
最近学习oracle的时候,无意中看到oracle的闪回技术flashback,原来oracle在delete数据或者drop的时候,不是直接删除,而是跟windows一样,先把数据放入到回收站中. ...
- NumPy Matplotlib库
NumPy - Matplotlib Matplotlib 是 Python 的绘图库. 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案. 它也可以和图形工具包一起使用,如 ...
- 十二道MR习题 – 1 – 排序
题目: 一个文件,大小约为100G.文件的每一行都是一个数字,要求对文件中的所有数字进行排序. 对于这个题目,了解过Hadoop的同学可以笑而不语了.即使用spark实现也是非常简单的事情. 先说下如 ...
- 智课雅思词汇---二十六、形容词后缀-ble
智课雅思词汇---二十六.形容词后缀-ble 一.总结 一句话总结: assemble 英 [ə'semb(ə)l] 美 [ə'sɛmbl] vt. 集合,聚集:装配:收集 vi. 集合,聚集 [ ...
- ctci1.1
) ; ; i < len; i++){ if(place.find(str[i]) == place.end()) place. ...
- spring3: AOP 之 通知参数
前边章节已经介绍了声明通知,但如果想获取被被通知方法参数并传递给通知方法,该如何实现呢?接下来我们将介绍两种获取通知参数的方式. 使用JoinPoint获取:Spring AOP提供使用org.asp ...
- IOS-第三方(SDWebImage)
SDWebImage ReadMe.md 文档 附:SDWebImage框架github下载地址:https://github.com/rs/SDWebImage注1:该文章简单翻译了SDWebIma ...
- CC国内厂商现状
(1)阿里云的产品 CC攻击 攻击者攻击服务器的认证页面.登录页面.游戏论坛等.还是用饭馆的例子,CC攻击相当于,坏人霸占收银台结账.霸占服务员点菜,导致正常的客人无法享受到服务. 游戏盾如何防御CC ...
- 【sparkSQL】创建DataFrame及保存
首先我们要创建SparkSession val spark = SparkSession.builder() .appName("test") .master("loca ...
- <input type="checkbox" name="" value=" ">
<input type="checkbox" name="" value=" ">