基于verilog的FFT算法8点12位硬件实现
FFT算法8点12位硬件实现 (verilog) 1
一.功能描述: 1
二.设计结构: 2
三.设计模块介绍 3
1.蝶形运算(第一级) 3
2.矢量角度旋转(W) 4
3.CORDIC 结果处理 除法单元模块 8
4.蝶形运算(第二,三级) 9
5.Vectoring CORDIC 模块 10
6.输出并转串模块 11
四.工程纵览 12
五.功能测试 13
六.工程结束遐想 14
一.功能描述:
对12位(带符号位)数据进行8点FFT计算
8个12位数据并行输入(懒得写前端的串转并模块,)
8个12位数据并行处理,计算
8个数据串行输出
二.设计结构:
图2.1 FFT并行计算模块
图2.2 输出并转串模块
图2.3 FFT算法结构
三.设计模块介绍
按数据流动方向依次介绍
1.蝶形运算(第一级)
图3.1 第一级蝶形运算算法结构
1.1硬件实现方式:
加法:直接运用12位加法器
减法:转换为补码形式后用加法计算
1.2 Verilog代码:
图3.1 第一级蝶形运算 verilog
2.矢量角度旋转(W)
图3.2 矢量角度旋转算法结构
2.1硬件实现方式:
0度:不加操作
-45度:使用Rotation CORDIC算法处理
-90度:使用总线交换,补码转换 方式处理
-135度:预旋转-90度后用Rotation CORDIC算法处理
(Rotation CORDIC 角度输入范围约为-99度到99度,后文有详细介绍)
2.2 Rotation CORDIC算法实现
Rotation CORDIC算法简单介绍
图3.2.1 Rotation CORDI 用于矢量角度旋转
为简化计算将cos()提出
出现两个布尔代数不太喜欢的运算cos与tan,
处理方法:
Tanθ:可见θ为最终要旋转的角。将Tanθ以一系列正或负2-n (此工程中n=7,6,5,4,3,2,1,0)的形式逼近。即每次旋转一个小角度(arctan(2-n))多次旋转后达到θ角
arctan(2-n)的值预先求出 直接由n调用
Cosθ:8个cos的乘积趋向于1/1.647=0.607 在输出端加上除法单元(移位实现1/2 + 1/8 -1/64=0.609)
算法伪代码:
For n=0 to [inf]
If (Z(n) >= 0) then
Z(n + 1) := Z(n) – atan(1/2^n);
Else
Z(n + 1) := Z(n) + atan(1/2^n);
End if;
End for;
If (Z(n) >= 0) then
X(n + 1) := X(n) – (Yn/2^n);
Y(n + 1) := Y(n) + (Xn/2^n);
Z(n + 1) := Z(n) – atan(1/2^n);
Else
X(n + 1) := X(n) + (Yn/2^n);
Y(n + 1) := Y(n) – (Xn/2^n);
Z(n + 1) := Z(n) + atan(1/2^n);
End if;
Rotation CORDI 硬件实现
参数:
角度输入范围: 约为-99~99度
实部X:任意12位数(含符号)
虚部Y:任意12位数(含符号)
图3.2.2 Rotation CORDI 硬件实现结构图
SHIFTER 模块:
将负数转为补码形式处理
分三级移位
图3.2.3 SHIFTER 模块 verilog
图3.2.4 SHIFTER 模块 RTL
TABLE 模块:
arctan(2-k)的值预先求出
用12位数表示-180~180的角度
方式如下:
1000_0000_0000 表示-180度
0100_0000_0000 表示90度
……
图3.2.5 TABLE 模块 verilog
X,Y MUX 与SUB/ADD模块:
原始数据要进行8次迭代,data_syn用于数据同步,确定何时输入原始数据
图3.2.6 MUX 模块 verilog
通过异或来确定是否取反(进行减法)
图3.2.7 SUB/ADD 模块 verilog
Z MUX 与SUB/ADD模块:
图3.2.8 MUX , SUB/ADD 模块 verilog
3.CORDIC 结果处理 除法单元模块
8个cos的乘积趋向于1/1.647=0.607 在输出端加上除法单元(移位实现1/2 + 1/8 -1/64=0.609)
图3.3.1 除法单元模块 verilog
4.蝶形运算(第二,三级)
图3.4.1 第二,三级蝶形运算算法结构
4.1硬件实现方式:
将减少资源使用量将第二与第三级运算在同一个硬件模块下循环进行
两级都是蝶形运算只要改变,选择适当的输入,就可在2个CLK下完成这两级运算。
图3.4.2 第二,三级蝶形运算硬件实现结构图
4.2 Verilog代码:
图3.4.3 第二,三级蝶形运算 MUX 模块 verilog
PS:对-90度的矢量旋转直接用总线交换,补码,的形式完成。
5.Vectoring CORDIC 模块
用于对矢量取模
参数:
X:任意大于0的12位数(含符号)
Y:任意12位数(含符号)
5.1算法简述:
通过判断Y的值,使Y趋向于0.使矢量旋转到X轴正方向。此时X坐标就是模值(要经过除法模块除1.647.前面以讲)
图3.5.1 Vectoring CORDI 硬件实现结构图
5.2 Verilog代码:
与 Rotation CORDI 类似 这儿不再重复
6.输出并转串模块
图3.6.1 并转串结构图
图3.6.2 并转串 verilog 部分
四.工程纵览
图4.1 工程总RTL
图4.2 工程并行计算模块RTL
图4.3工程资源利用结果
五.功能测试
为了使硬件定点实现FFT时,输出寄存器能支持比输入信号幅值大的多的数据,在最后有加除8除法器。毕竟我们更关注的是DFT的相对幅值。
图5.1 仿真测试结果
六.工程结束遐想
1. 迭代,用二进制数逼近任何数,有点二分法的感觉,又有点向微积分
2. 乘法,除法,与移位的关系,分级运算的妙用
3. 依旧是时间与空间的折中考虑,相互转化
4. 流水下线拆分逻辑,提高速度
5. 时序与逻辑的严密考虑,使时序下的逻辑按我们的下发进行吗,无论是 串行还是并行
6. 循环节省了资源,使处理速度减慢
7. 加减法与补码的关系
8. 细分模块 封装好输入输出 可是调试更方面,,思路更清晰
9. 准确计算每个模块的耗时,便于模块间逻辑的链接
基于verilog的FFT算法8点12位硬件实现的更多相关文章
- 2维FFT算法实现——基于GPU的基2快速二维傅里叶变换
上篇讲述了一维FFT的GPU实现(FFT算法实现——基于GPU的基2快速傅里叶变换),后来我又由于需要做了一下二维FFT,大概思路如下. 首先看的肯定是公式: 如上面公式所描述的,2维FFT只需要拆分 ...
- FFT算法实现——基于GPU的基2快速傅里叶变换
最近做一个东西,要用到快速傅里叶变换,抱着蛋疼的心态,自己尝试写了一下,遇到一些问题. 首先看一下什么叫做快速傅里叶变换(FFT)(来自Wiki): 快速傅里叶变换(英语:Fast Fourier T ...
- 基于Verilog HDL整数乘法器设计与仿真验证
基于Verilog HDL整数乘法器设计与仿真验证 1.预备知识 整数分为短整数,中整数,长整数,本文只涉及到短整数.短整数:占用一个字节空间,8位,其中最高位为符号位(最高位为1表示为负数,最高位为 ...
- JavaScript基于时间的动画算法
转自:https://segmentfault.com/a/1190000002416071 前言 前段时间无聊或有聊地做了几个移动端的HTML5游戏.放在不同的移动端平台上进行测试后有了诡异的发现, ...
- FFT算法
FFT算法的完整DSP实现 傅里叶变换或者FFT的理论参考: [1] http://www.dspguide.com/ch12/2.htm The Scientist and Engineer's G ...
- 基于ReliefF和K-means算法的医学应用实例
基于ReliefF和K-means算法的医学应用实例 数据挖掘方法的提出,让人们有能力最终认识数据的真正价值,即蕴藏在数据中的信息和知识.数据挖掘 (DataMiriing),指的是从大型数据库或数据 ...
- 基于Verilog HDL 的数字电压表设计
本次实验是在“基于Verilog HDL的ADC0809CCN数据采样”实验上进一步改进,利用ADC0809采集到的8位数据,进行BCD编码,以供查表方式相加进行显示,本次实验用三位数码管. ADC0 ...
- FFT算法的完整DSP实现(转)
源:FFT算法的完整DSP实现 傅里叶变换或者FFT的理论参考: [1] http://www.dspguide.com/ch12/2.htm The Scientist and Engineer's ...
- 基于FPGA的Cordic算法实现
CORDIC(Coordinate Rotation Digital Computer)算法即坐标旋转数字计算方法,是J.D.Volder1于1959年首次提出,主要用于三角函数.双曲线.指数.对数的 ...
随机推荐
- AngularJS:控制器
ylbtech-AngularJS:控制器 1.返回顶部 1. AngularJS 控制器 AngularJS 控制器 控制 AngularJS 应用程序的数据. AngularJS 控制器是常规的 ...
- Secure CRT修改文件夹的颜色
secureCRT有一个很大的问题是,如果设置Emulation Terminal 为Linux模式,则ls的时候,目录的蓝色跟背景的黑色非常接近,很难看清楚,修改办法 option->Glob ...
- 1.solr学习速成之配置文件
什么是solr Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引:也可以通过H ...
- MongoDB在Windows下的环境配置和使用
总是觉得配置环境是一个超级麻烦的事情啊,而且网上说的又比较乱,配置完后又没有说怎么开始运行,在哪输入增删改查语句,像突然断层一样.所以就在这里详细说说. 一:下载安装 1.去官网的下载页面 2.下载完 ...
- 利用HADOOP中的jar写一个RPC
RPC调用需要服务端和客户端使用相同的协议: 协议: package cn.itcast.bigdata.hadooprpc.protocol; public interface IUserLogin ...
- oracle——存储过程参数
oracle 存储过程类型: 1.in:输入类型,即由应用程序将数据传入oracle存储过程中:这种参数在存储过程中是只读参数,在存储过程中无法对该类型的参数进行修改: 2.out:输出参数,是在存储 ...
- 虚拟机之 Wordpress博客搭建
WordPress博客需要LAMP环境,--- LAMP 官网:https://cn.wordpress.org/ wordpress-4.4.1版本环境要求是: php 5.2.4或以上 mysq ...
- Hadoop IO 特性详解(2)
(本文引用了microheart,ggjucheng的一些资料,在此感谢.charles觉得知识无价,开源共享无价) 这一次我们接着分析文件IO校验的相关代码,看看最底层是如何实现这种大数据集的文件校 ...
- [转] const T、const T*、T *const、const T&、const T*& 的区别
这里的T指的是一种数据类型,可以是int.long.doule等基本数据类型,也可以是自己类型的类型class.单独的一个const你肯定知道指的是一个常量,但const与其他类型联合起来的众多变化, ...
- Game Develop Books
[Working On] [Pending] 3.<实时计算机图形学> 4.<游戏编程精粹1> 5.<游戏编程精粹2> 6.<3D游戏引擎设计:实时计算机图形 ...