利用UltraScale和UltraScale+FPGA和MPSOC加速DSP设计生产力

Accelerating DSP Design Productivity with UltraScale and UltraScale+ FPGAs and MPSoCs

由于其固有的灵活性,Xilinx fpga和soc是高性能或多通道数字信号处理(DSP)应用的理想选择,可以利用硬件并行性。Xilinx FPGA和SOC将这种处理带宽与全面的解决方案相结合,包括为硬件设计师、软件开发人员和系统架构师提供的易于使用的设计工具。

硬件并行

标准Von Neumann DSP架构需要256个周期才能完成256个抽头的FIR滤波器,而Xilinx fpga可以在单个时钟周期内实现相同的结果。

这种巨大的并行性转化为卓越的DSP性能:

22 TB的定点性能

单精度浮点7.3兆浮点

半精度浮点11兆浮点

全面的DSP解决方案

Xilinx DSP解决方案包括硅、IP、参考设计、开发板、工具、文档和培训,以实现广泛市场的广泛应用,包括但不限于无线通信、数据中心、航空航天和国防。

综合开发流程

对于不同的使用模型和不同的设计抽象级别,可以使用各种工具流:

硬件设计师可以设计:

使用Vivado设计套件完成RTL和系统级设计

C/C++与Vivado高级综合

Matlab和Simulink使用用于DSP的系统生成器.

在C/C++开发中使用的软件开发人员可以设计使用:

Vivado高级合成

使用Zynq-7000和ZynqUltraScale的基于SoC的设计的SDSoC+

SDAccel公司 用于数据中心加速

系统架构师可以通过以下方式快速评估新算法:

用Matlab或Simulink进行系统建模的DSP系统生成器

C语言或C++语言中的VIVADO高级算法

基于ASIC类架构,Xilinx FPGA结合了每秒数百千兆位的I/O带宽和超过20兆兆瓦的固定点DSP性能+ 家庭。XilinxDSP芯片及其并行性是最新一代Xilinx FPGA实现DSP性能的关键。

DSP片结构

超尺度 DSP48E2片是Xilinx体系结构中的第五代DSP片。

此专用DSP处理块采用全定制硅实现,提供业界领先的功率/性能,允许高效实现流行的DSP功能,如乘法累加器(MACC)、乘法加法器(MADD)或复数乘法。

slice还提供了执行不同类型逻辑操作的能力,例如AND、OR和XOR操作(UG579)。

UltraScale体系结构建立在7系列(DSP48E1)的成功基础上,并进一步增强:

更宽的乘法器(27 x 18位)

通过平方MUX使预加法器输出平方的能力

新的宽MUX功能允许真正的3输入加法器后的乘法器

特色视频:

利用DSP48E2片上的平方MUX

在DSP48E2片上利用宽MUX反馈

工具和流程

根据您的设计偏好,Xilinx有支持RTL、C/C++和基于模型的设计条目的工具。设计流程中的这种灵活性,加上广泛的DSP IP目录,有助于更容易地采用Xilinx工具和设备。

Vivado IDE作为系统级设计的一个设计驾驶舱,它提供了构建完整设计、实现它并编写位文件来编程设备的能力。

利用UltraScale和UltraScale+FPGA和MPSOC加速DSP设计生产力的更多相关文章

  1. FPGA的CNN加速,你怎么看?

    网上对于FPGACNN加速的研究已经很多了,神经网络的硬件加速似乎已经满大街都是了,这里我们暂且不讨论谁做的好谁做的不好,我们只是根据许许多多的经验来总结一下实现硬件加速,需要哪些知识,考虑哪些因素. ...

  2. Xilinx FPGA控制器的Everspin STT-DDR4设计指南

    自旋转移扭矩磁阻随机存取存储器(STT-MRAM)是一种持久性存储技术,可利用各种工业标准接口提供性能,持久性和耐用性. Everspin推出了STT-MRAM产品,该产品利用称为JE-DDR4的JE ...

  3. 012 基于FPGA的网口通信实例设计【转载】

    一.网口通信设计分类 通过上面其他章节的介绍,网口千兆通信,可以使用TCP或者UDP协议,可以外挂PHY片或者不挂PHY片,总结下来就有下面几种方式完成通信: 图8‑17基于FPGA的网口通信实例设计 ...

  4. 基于FPGA的XPT2046触摸控制器设计

    基于FPGA的XPT2046触摸控制器设计 小梅哥编写,未经许可,文章内容和所涉及代码不得用于其他商业销售的板卡 本实例所涉及代码均可通过向 xiaomeige_fpga@foxmail.com  发 ...

  5. 基于FPGA的SPI FLASH控制器设计

    1.SPI FLASH的基本特征 本文实现用FPGA来设计SPI FLASH,FLASH型号为W25Q128BV.支持3种通信方式,SPI.Dual SPI和Quad SPI.FLASH的存储单元无法 ...

  6. 利用neon技术对矩阵旋转进行加速

    一般的矩阵旋转操作都是对矩阵中的元素逐个操作,假设矩阵大小为m*n,那么时间复杂度就是o(mn).如果使用了arm公司提供的neon加速技术,则可以并行的读取多个元素,对多个元素进行操作,虽然时间复杂 ...

  7. 利用neon技术对矩阵旋转进行加速(2)

    上次介绍的是顺时针旋转90度,最近用到了180度和270度,在这里记录一下. 1.利用neon技术将矩阵顺时针旋转180度: 顺时针旋转180度比顺时针旋转90度容易很多,如下图 A1 A2 A3 A ...

  8. FPGA基础学习(9) -- 复位设计

    目录 1. 常见问题 2. 常见的复位方式 3. 合理的复位设计 3.1 复位电平 3.2 异步复位同步化 3.3 恰到好处的复位 4. 补充 4.1 所谓的上电初始化 参考文献 一开始接触到FPGA ...

  9. [FPGA] Verilog 燃气灶控制器的设计与实现

    燃气灶控制器的设计与实现 一.引述 本次实验所用可编程器件型号为MAXII EPM1270T144C5(其引脚表见本人另一博文:可编程实验板EPM1270T144C5使用说明),通过可编程实验板实现一 ...

随机推荐

  1. C/C++ 手工实现IAT导入表注入劫持

    DLL注入有多种方式,今天介绍的这一种注入方式是通过修改导入表,增加一项导入DLL以及导入函数,我们知道当程序在被运行起来之前,其导入表中的导入DLL与导入函数会被递归读取加载到目标空间中,我们向导入 ...

  2. 书评第001篇:《C++黑客编程揭秘与防范》

    本书基本信息 作者:冀云(编著) 出版社:人民邮电出版社 出版时间:2012-6-1 ISBN:9787115280640 版次:1 页数:265 字数:406000 印刷时间:2012-6-1 开本 ...

  3. hdu4975 行列和构造矩阵(dp判断唯一性)

    题意:       和hdu4888一样,只不过是数据加强了,就是给你行列的和,让你构造一个矩阵,然后判断矩阵是否唯一. 思路:       构造矩阵很简单,跑一次最大流就行了,关键是判断矩阵的唯一性 ...

  4. POJ 2516 基础费用流

    题意       有n个顾客,m个供应商,k种货物,给你顾客对于每种货物的要求个数,和供应商对于每种货物的现有量,以及供应每种货物的时候供应商和顾客之间的运输单价,问你满足所有顾客的前提下的最小运输费 ...

  5. Python脚本暴力破解FTP口令(ftplib)

    目录 判断FTP服务器是否允许匿名登录 暴力破解FTP口令 列出FTP目录内的网页文件 综合 环境:Windows python2.7.15 ftplib模块是python下用于ftp服务的模块 . ...

  6. XCTF-i-get-id-200

    i-get-id-200 题目描述 嗯..我刚建好了一个网站 解题过程 一共有三个页面 Hello World 告诉了页面是perl写的 Forms 输入name和age会返回渲染后的字符串 搜了一下 ...

  7. java8中的日期和时间API

    一.背景 jdk 1.8 之前, Java 时间使用java.util.Date 和 java.util.Calendar 类. Date today = new Date(); System.out ...

  8. Asp.NetCore Web开发之ADO.Net

     Asp.NetCore可以说是.Net平台开发网站的一大利器,最近的一大段时间,就要跟大家分享,如何使用这一利器开发网站项目. 要学习网站开发,首先要学习如何使用ADO.Net进行数据库数据的增删改 ...

  9. SQL Server强制使用特定索引 、并行度、锁

    SQL Server强制使用特定索引 .并行度 修改或删除数据前先备份,先备份,先备份(重要事情说三遍) 很多时候你或许为了测试.或许为了规避并发给你SQL带来的一些问题,常常需要强制指定目标sql选 ...

  10. Smss.exe加载win32k.sys过程总结

    windows操作系统初始化 windows操作系统再初始化的过程中,当内核完全初始化而且各个组件也已经准备好后会加载一个个用户进程smss.exe(会话管理器),此进程会接着调用NtSetSyste ...