FFT HDL Optimized模块HDL综合代码生成及与Xilinx xfft IP MEX接口精度详细比较

　　前面一篇随笔叙述了关于MATLAB中FFT_HDL_Optimzed模块定点（IEEE754单精度float格式）二进制与十进制转换实现，有需要的往前翻一下即可。这一篇随笔将叙述 FFT HDL Optimized 模块实现 8192 burst Radix 2 结构的定点 FFT (定点格式依照 IEEE-754 single-precision format，小数为 23 位二进制精度)，并通过 Xilinx LogiCORE FFT MEX Function interface 进行单精度浮点与 FFT HDL Optimzed 模块定点输出的正确性（误差性）检测过程,并附加FFT HDL Optimized 模块 8192 Streaming Radix 2^2 详细测试。

Parameters:

　　整个系统输入为 32 位 1D array of complex data 单精度浮点数据,FFT HDL Optimized 模块生成是基于 MATLAB2018b，Vivado 2018.3，Modelsim SE-64 10.7 平台。FFT HDL Optimized 模块的参数

　　①FFT Length = 8192

　　②Burst Radix 2

　　③顺序输入顺序输出

具体步骤:

　　（1）进入 MATLAB2018b，打开 Simulink,新建 mode，My_fft；

　　（2）接入如图所示模块；

Simulink 整体框图例如图所示：（for example）

subsys 子系统框图如图所示：

　　其中 valid 给高电平，输入有效，而 data 通过 Sine Wave 模块进行输入，其中 fft_input_s、fft_hdl_in、fft_hdl_out 均为 To Workspace 模块（Savemode 选择 array），convert 模块转换输入的数据形式：32 位 1D array of complex data 浮点->32 为 fixdt(1,32,14),To Sample 模块改变输出信号的采样模式。重要模块的参数设置如图：

Sine Wave 模块

FFT HDL Optimized 模块

　　（3）Simulink run simulation，仿真成功后，在 Workspace 会出现三个参数

的值：fft_hdl_in、fft_hdl_out、fft_input_s（后面会用到）；

　　（4）回到 MATLAB 命令窗口中，返回到 simulink mode-My_fft 所在的目录；

　　（5）建立 Synthesis Tool Path，通过使用 hdlsetuptoolpath 命令；

　　（6）在 MATLAB 命令窗口中，输入 hdlsetup(My_fft)；

　　（7）在 simulink 中，选择 code>HDL Code>HDL Workflow Advisor；

　　（8）在 HDL Workflow Advisor 窗口中，在 Set Target > Set Target Device and Synthesis Tool step, for Synthesis tool, select Xilinx Vivado and click Run This Task；

　　（9）在 Set Target > Set Target Frequency step，click run the task；

　　（10）Right-click Prepare Model For HDL Code Generation and select Run All；

　　（11）In the HDL Code Generation > Set Code Generation Options > Set Basic Options step, select the following options, then click Apply:

　　• For Language, select Verilog.

　　• Enable Generate traceability report.

　　• Enable Generate resource utilization report.

　　（12）Right-click the HDL Code Generation > Generate RTL Code and Testbenchstep, and select Run to Selected Task.（在 Run to Selected 之前需要勾上 Generate RTL code 和 Generate RTL testbench）;

　　（13）等待一段时间，成功后会生成对应的报告，代码在指定的目录文件下；下面步骤为生成 FFT HDL 代码后进行 Modelsim 仿真，如果不需要进行仿真可以跳过（14）-（16）下面的步骤

　　（14）进入 Modelsim software，通过 tcl 切换到刚刚生成 HDL 代码的目录；

　　（15）在 tcl 输入 subsys_tb_compile.do；

　　（16）在 tcl 输入 subsys_tb_sim.do；

　　结束 Modelsim 仿真，下面为 FFT HDL Optimized 模块的正确性（误差性）检测过程,检测过程为使用 Xilinx 提供的 xfft MATLAB mex 函数接口进行检测：

　　（17）打开 Vivado 软件，新建工程，在 Vivado IP 目录输入 FFT，找到LogiCORE Fast Fourier Transform,设置与前面对应的参数（FFT_length、Arch、浮点处理类型）,最后点 generate IP；

　　（18）IP 生成后，回到工程目录，找到xxx\xxx.srcs\sources_1\ip\xfft_0\cmodel 文件，解压 xfft_v9_1_bitacc_cmodel_nt64.zip 压缩包（适合与 windows 系统，对于linux 系统解压 xfft_v9_1_bitacc_cmodel_lin64.zip 压缩包），解压完成，得到下面文件：

　　（19）打开 MATLAB，在 MATLAB 命令窗口跳转到xfft_v9_1_bitacc_cmodel_nt64.zip 压缩包解压文件目录下；

　　（20）在执行下面步骤之前，电脑需要安装有编译器如 Microsoft Visual Studio 201x、MinGW64 等，可以通过 mex –setup 指令进行查看是否安装，也可以指定编译器；

　　（21）执行 make_xfft_v9_1_mex.m 来建立 MEX function（而如何实现的自己可以网上搜一下）；

　　（22）在当前目录查看是否存在 xfft_v9_1_bitacc_mex.mexw64 文件（windows 系统）；

　　（23）通过在命令窗口运行 xfft_v9_1_bitacc_mex.mexw64 FFT MEX function 可以看到它的输入输出参数细节：[output_data, blk_exp, overflow] = xfft_v9_1_bitacc_mex(generics,nfft, input_data,scaling_sch, direction)（具体参数情况可以参照 pg109-xfft Xilinx 官方手册，而手册可以直接去Xilinx 官网也可以在 Logicore FFT IP 核生成的时候点击上方的 help 来查找文档）；

　　（24）之后打开 run_xfft_v9_1_mex.m 文件（MEX Function Example Code），需要对文件进行参数的修改（参数含义看 xfft_）：

1 　　generics.C_NFFT_MAX = 13; %fft length = 8192

2 　　generics.C_ARCH = 2; %Burst Radix 2

3 　　generics.C_HAS_NFFT = 0;

4 　　generics.C_USE_FLT_PT = 1; %浮点

5 　　generics.C_INPUT_WIDTH = 32; % Must be 32 if C_USE_FLT_PT = 1

6 　　generics.C_TWIDDLE_WIDTH = 24; % Must be 24 or 25 if C_USE_FLT_PT =1

7 　　generics.C_HAS_SCALING = 0; % Set to 0 if C_USE_FLT_PT = 1

8 　　generics.C_HAS_BFP = 0; % Set to 0 if C_USE_FLT_PT = 1

9 　　generics.C_HAS_ROUNDING = 0; % Set to 0 if C_USE_FLT_PT = 1

部分代码进行注释

 1 % % Check xk_re and xk_im data: Only xk_re[0] should be non-zero

 2 % if output(1) ~= expected_xk_re_0

 3 % if channels > 1

 4 % error('ERROR: Channel %d xk_re[0] is incorrect:

 5 expected %f + j%f, actual %f +

 6 j%f\n',channel,real(expected_xk_re_0),imag(expected_xk_re_0),real(out

 7 put(1)),imag(output(1)))

 8 % else

 9 % error('ERROR: xk_re[0] is incorrect: expected %f + j%f,

10 actual %f +

11 j%f\n',real(expected_xk_re_0),imag(expected_xk_re_0),real(output(1)),

12 imag(output(1)))

13 % end

14 % end

15 %

16 % % Check all other sample values are zero

17 % for n = 2:samples

18 % if output(n) ~= 0 + 0j

19 % if channel > 1

20 % error('ERROR: Channel %d output sample %d is incorrect:

21 expected %f +j%f, actual %f +

22 j%f\n',channel,n,0.0,0.0,real(output(1)),imag(output(1)))

23 % else

24 % error('ERROR: output sample %d is incorrect: expected %f

25 +j%f, actual %f + j%f\n',n,0.0,0.0,real(output(1)),imag(output(1)))

26 % end

27 % end

28 % end

　　（25）运行配置好的 run_xfft_v9_1_mex.m 文件,之后再修改 run_xfft_v9_1_mex.m 文件，修改：input_raw(1:samples) = fft_input_s(1:samples);其他条件不变，再次运行配置好的 run_xfft_v9_1_mex.m 文件；

　　（26）在 Worksapce 找到 out 变量（其中 out 变量为经过 FFT MEX Function 得到的结果，经 FFT MEX Function 处理了浮点数据之后得到的 double 类型数据）；

　　（27）之后在命令行 fft_hdl_out_test(1:8192)=fft_hdl_out(57578:65769);（其中 fft_hdl_out 为经过 FFT HDL Optimized 定点输出数据，而从 57578 开始是因为 57577 及前面的数据为 input 与 output 之间的 Latency，所有值为0）；

~~~~~~~~

~~~~

　　（28）进行FFT数据的比较，即Xilinx LogiCORE FFT IP核运算输出结果与Simulink FFT HDL Optimized模块输出结果对比，通过编写一个脚本，用plot函数进行对比：

测试说明：

　　①测试是通过对 FFT HDL Optimized 的输出或 FFT HDL Optimized 输出经过convert 定点转浮点的输出结果的绝对值 A 与 Xilinx FFT MEX Function 接口输出 B 绝对值之间的差值:abs(A)-abs(B)；

　　②在测试中，以 Xilinx FFT MEX Function 输出为参考值（标准值）；

　　③在进行 diff/reference result 计算时，因为 result 值太小及出现一些问题所以没有进行百分比的显示，现在给出 abs(Xilinx FFT MEX Function 接口输出 B)的图解，测试时 Sine 模块幅值为 0.9，以第一个 8192 点为例，在其他计算情况下，结果基本相同：

测试一

　　Xilinx FFT MEX 函数的接口的运算方式设置为浮点测试，convert 模块转换输出的数据形式为 fixdt(1,32,14)，（Sine 模块的幅值为 1.0）abs(fft_hdl_out_test(countx))-abs(output(countx))FFT HDL Optimized 模块的 Data Types 为 Rounding Method = Floor

abs(fft_hdl_out_test(countx)- output(countx))

测试二

　　Xilinx FFT MEX函数的接口的运算方式设置为浮点测试，修改convert模块转换输出的数据形式（其他条件不变）：fixdt(1,32,23)，与IEEE-754

single-precision 格式一致，小数部分为23位二进制精度，（Sine模块的幅值为1.0）FFT HDL Optimized模块的Data Types为Rounding Method = Floor

abs(fft_hdl_out_test(countx))-abs(output(countx))

测试三

　　Xilinx FFT MEX函数的接口的运算方式设置为浮点测试，修改Simulinkmode 中Sine模块的幅值为0.9（与测试四相比其他条件不变）fixdt(1,32,23)，

与IEEE-754 single-precision 格式一致，小数部分为23位二进制精度FFT HDL Optimized模块的Data Types为Rounding Method = Floor

abs(fft_hdl_out_test(countx))-abs(output(countx))

测试四

　　Xilinx FFT MEX 函数的接口的运算方式设置为定点测试，修改 convert模块转换输出的数据形式（其他条件不变）：fixdt(1,32,23)，与 IEEE-754

single-precision 格式一致，小数部分为 23 位二进制精度，且run_xfft_v9_1_mex.m 文件中 generics.C_TWIDDLE_WIDTH 设置为 26;

FFT HDL Optimized模块的Data Types为Rounding Method = Floor

　　（Sine 模块的幅值为 0.9）

测试五

　　Xilinx FFT MEX 函数的接口的运算方式设置为浮点测试，fixdt(1,32,23)，与 IEEE-754 single-precision 格式一致，小数部分为 23

位二进制精度，结构改为 Streaming Radix 2^2 ，此为第一个 8192 点FFT HDL Optimized模块的Data Types为Rounding Method = Floor

　　（Sine 模块的幅值为 0.9）

　　Xilinx FFT MEX 函数的接口的运算方式设置为浮点测试， fixdt(1,32,23)，与 IEEE-754 single-precision 格式一致，小数部分为 23 位二进制精度，

结构改为 Streaming Radix 2^2 ，此为测试五第二个 8192 点

　　（Sine 模块的幅值为 0.9）

　　Xilinx FFT MEX 函数的接口的运算方式设置为浮点测试，fixdt(1,32,23)，与 IEEE-754 single-precision 格式一致，小数部分为 23位二进制精度，结构改为 Streaming Radix 2^2 ，此为测试五第三个 8192点

　　（Sine 模块的幅值为 0.9）

　　Xilinx FFT MEX 函数的接口的运算方式设置为定点测试，fixdt(1,32,23)，与 IEEE-754 single-precision 格式一致，小数部分为 23位二进制精度，且 run_xfft_v9_1_mex.m 文件中 generics.C_TWIDDLE_WIDTH设置为 26;结构改为 Streaming Radix 2^2 ，此为测试五第三个 8192 点