如何保证FPGA PCIe唤醒能满足PC的100ms 的时间要求(Autonomous Mode)?
原创By DeeZeng [ Intel FPGA笔记 ]
PC 需要PCIe设备在 100ms 内启动,这样PC 才能扫描到PCIe 设备。对于 FPGA PCIe 板卡,同样也需要满足这个时间要求。
Intel FPGA系列是基于sram的,也就是掉电丢失,所以会需要配置器件。配置模式有很多种,以我们常见的 ASx4 和 FPP为例:
1. ASx4 :只需要一颗 EPCS/PECQ 即可配置
2. FPP : 需要一个额外外部Host 用来搬移 配置数据,由于是并行 x8 x16 x32,配置时间会少很多。
如下抽出两张 Cyclone V 和 Arria 10 的 AS FPP 配置时间差异


PCIe 100ms 或FPGA 120 ms 的时间(请具体分析之后给出的 Figure 2-2 ,Table 2-1图片),可不单纯包含FPGA configuration Time,还包含Ramp Time ,POR Time等。
减去这两项时间,那FPGA configuration 80 ms 左右的都有点不保险了。

也就是当我们 Cyclone V 逻辑资源大的器件,或Arria10 器件,当使用AS x4模式的时候,PCIe应用会满足不了唤醒时间!
(Arria10的最大两个器件,甚至FPP32时间也满足不了)
而实际硬件设计或板子必须或已经采用 EPCQ方案了(毕竟很多情况只会用一颗EPCQ,而不用FPP的 外部Host+并行Flash)
那如何解决呢?
- 外接供电,先于 Host 开机。 (好吧,这用起来几多麻烦)
- PCIe供电,Host 开机两次。(重启FPGA不需要再配置)
- Autonomous PCIe HIP Mode (注意要器件支持这个功能)
什么是Autonomous PCIe HIP模式?
Autonomous 模式对满足PCIe 100ms 唤醒时间非常有用。Intel FPGA设备会先接收periphery image,然后再接收 Core image.
配置完Core image 后,FPGA进入user mode. 在Autonomous HIP 模式下,PCIe Hard IP 在periphery image配置完后就能工作,
完成Link Training 后,PCIe Hard IP 就能响应 host, 从而减少唤醒时间。 而不用等到 Core image 配置完进入user mode才开始。
Autonomous PCIe HIP Mode 和 CvP 的模式是类似的,如下以CVP的两张图类比说明Autonomous PCIe HIP Mode 与否的差异。
PCIe Active的 时间 = a(ramp time) + b (POR) + Program and calibrate
https://www.intel.com/content/dam/www/programmable/us/en/pdfs/literature/ug/ug_a10_cvp_prop.pdf
1. Autonomous PCIe HIP Mode : 只需 program Periphery image ,Hard PCIe就起来了。

2. 非Autonomous PCIe HIP Mode : 需要Program Full image ,Hard PCIe才起来。

所以使能Autonomous PCIe HIP Mode 可以减少 (Full image - Periphery image)数量的Config bits,大大缩短时间。
这么有用,那如何设置 Autonomous 模式呢?简单,在 Quartus 工程中设置勾选一下即可。

Cyclone V,Arria V 和 Stratix V 以及之后出来的 Arria 10 ,Stratix 10 等 都支持 autonomous PCIe HIP Mode.
注意: 1. PCIe Hard IP。 2. 支持这个功能的器件。
这样开机无法找到PCIe,重启才能找到的案例。打开这个模式之后,第一次开机就能直接找到PCIe啦。
What? 担心打开了Autonomous PCIe HIP Mode还是无法满足 PCIe的唤醒100ms时间要求?
那我们来进行一次具体计算,看如何计算这些时间
以 Arria10 1150的器件,使用AS x4 来计算(其他系列计算类似)
PCIe Active的时间 = a(ramp time) + b (POR) + Program and calibrate
1. Ramp Time: Ramp Time 这是FPGA开发板 Power 电路决定的
假设10ms
2. POR delay: 这个delay是,POR电路监控的所有Power都起来了,然后delay一个时间用以保证,FPGA准备好被配置。

可以看到 Fast POR 和 Standard POR 是有很大差异的,我们必须设置MSEL,将POR切到 Fast
这里算 fast 的 12ms
3. Program and calibrate
3.1 Program periphery image

为计算配置periphery image的时间:
这里 Configuration File size 我们用 periphery image : Datasheet中CvP的IOCSR数据 2756096

Number of data line 用 AS x4 的 4
DCLK 用 AS 的 100MHz
config time = 2756096/4* (1/100MHz) = 6.9 ms (远小于 full image 的 800+ ms)
3.2 Calibrate
Transceiver calibration begins with the bottom PCIe IP core on eachside of the device. Consequently, this IP core has a faster wake up time
这个时间在 A10 是有一个nios硬核ip 会进行calibration,从bottom的开始。时间花费应该不多。
所以打开 Autonomous Mode总时间为: 10 + 12 + 6.7 + 少量Calibrate时间 ≈ 30ms ,很简单就满足PCIe唤醒时间要求。
重复一下这张图: 我们Arria10 1150K,用ASx4的EPCQ config periphery image 都只需要 7ms 不到,那这张图的timing应该很好满足了。
不过硬件的 Ramp Time应该是影响的,如果超了10ms (别超),也许就是 和 ramp+POR+config 的时间加起来和 120ms 对比了

是否会算了呢?
按上面的计算,A10 最大器件用ASx4 也没问题。
这样 Arria10 以下28nm以上的器件直接打开 Autonomous PCIe HIP Mode 就好哟。
如何保证FPGA PCIe唤醒能满足PC的100ms 的时间要求(Autonomous Mode)?的更多相关文章
- 推荐 的FPGA设计经验(3) 物理实现和时间闭环优化
Optimizing Physical Implementation and Timing Closure Planning Physical Implementation When planning ...
- HC-08 BLE资料
1.1 特点简介 HC-08蓝牙串口通信模块是新一代的基于Bluetooth Specification V4.0 BLE蓝牙协议的数传模块.无线工作频段为 2.4GHz ISM,调制方式是 GFSK ...
- PC和FPGA间的串口通信实现
应用笔记 V1.0 2015/03/26 PC和FPGA间的串口通信实现 概述 本文将介绍PC和FPGA间的串口通信实现的基本思路和Verilog代码,对于通信而言,收发双方都要有相应的控制. ...
- FPGA Timing笔记
很多FPGA工程师都会遇到timing的问题,如何让FPGA跑到更快的处理频率是永久话题.决定FPGA的timing关键是什么?如何才能跑到更快的频率呢? A. 第一步需要了解FPGA的timing路 ...
- 基于WDF的PCI/PCIe接口卡Windows驱动程序(4)- 驱动程序代码(源文件)
原文出处:http://www.cnblogs.com/jacklu/p/4687325.html 本篇文章将对PCIe驱动程序的源文件代码作详细解释与说明.整个WDF驱动程序工程共包含4个头文件(已 ...
- PCIE_DMA实例四:xapp1052在Xilinx 7系列(KC705/VC709)FPGA上的移植
PCIE_DMA实例四:xapp1052在Xilinx 7系列(KC705/VC709)FPGA上的移植 一:前言 这段时间有个朋友加微信请求帮忙调试一块PCIe采集卡.该采集卡使用xilinx xc ...
- FPGA开发流程
需求说明:Verilog设计 内容 :FPGA开发基本流程及注意事项 来自 :时间的诗 原文来自:http://www.dzsc.com/data/2015-3-16/1080 ...
- 基于FPGA Manager的Zynq PL程序写入方案
本文主要描述了如何在Linux系统启动以后,在线将bitstream文件更新到ZYNQ PL的过程及方法.相关内容主要译自xilinx-wiki,其中官网给出了两种方法,分别为Device Tree ...
- FPGA资源平民化的新晋- F9 技术解析
FPGA (现场可编程门阵列)由于其硬件并行加速能力和可编程特性,在传统通信领域和IC设计领域大放异彩.一路走来,FPGA并非一个新兴的硬件器件,由于其开发门槛过高,硬件加速算法的发布和部署保护要求非 ...
随机推荐
- leadcode的Hot100系列--17. 电话号码的字母组合--回溯的另一种想法的应用
提交leetcode的时候遇到了问题,一直说访问越界,但仔仔细细检查n多遍,就是检查不出来. 因为我用到了count全局变量,自加一来表明当前数组访问的位置, 后来突然想到,是不是在leetcode在 ...
- 前端Web浏览器基于Flash如何实时播放监控视频画面(前言)之流程介绍
[关键字:前端浏览器如何播放RTSP流画面.前端浏览器如何播放RTMP流画面] 本片文章只是起到抛砖引玉的作用,能从头到尾走通就行,并不做深入研究.为了让文章通俗易懂,尽量使用白话描述. 考虑到视频延 ...
- SpringBoot系列——Logback日志,输出到文件以及实时输出到web页面
前言 SpringBoot对所有内部日志使用通用日志记录,但保留底层日志实现.为Java Util Logging.Log4J2和Logback提供了默认配置.在不同的情况下,日志记录器都预先配置为使 ...
- Ubuntu 16.4-desktop系统安装显卡CUDA具体步骤!
1.禁用nouveau驱动(切换至tty界面) sudo vim /etc/modprobe.d/blacklist.conf 在文本最后添加:blacklist nouveau options no ...
- [AI开发]目标跟踪之速度计算
基于视频结构化的应用中,目标在经过跟踪算法后,会得到一个唯一标识和它对应的运动轨迹,利用这两个数据我们可以做一些后续工作:测速(交通类应用场景).计数(交通类应用场景.安防类应用场景)以及行为检测(交 ...
- 用PHP抓取百度贴吧邮箱数据
注:本程序可能非常适合那些做百度贴吧营销的朋友. 去逛百度贴吧的时候,经常会看到楼主分享一些资源,要求留下邮箱,楼主才给发. 对于一个热门的帖子,留下的邮箱数量是非常多的,楼主需要一个一个的去复制那些 ...
- WeUI Picker组件 源代码分析
前言 由于最近做的一个移动端项目需要使用到类似 WeUI Picker组件 的选择效果, 所以在这里来分析下 WeUI Picker 的实现逻辑.(weui.js项目地址) 之前也做过类似的组件, ...
- 解决webpack打包速度慢的解决办法
技巧1 webpack在打包的时候第一次总是会做很长的准备工作,包括加载插件之类的.在刚接触webpack的时候总是webpack一下-测一下-改一下-再webpack一下,这种方式最后让很多人崩溃了 ...
- eclipse+MyEclipse+WebLogic开发简单的EJB
转载自http://blog.sina.com.cn/s/blog_678530f60100hxaf.html 说是转载,其实这是我个人在几年前新浪博客上发表的文章. 帮导师搞了一周的EJB,总算初步 ...
- C# ExcelAddIn 开发笔记
好久都没有写博客了,最近真的是太忙了,接手公司要做的一个小的新的项目,从接触认识到一个新东西,再到自己琢磨研究,最终结合公司业务把整个excel插件项目完成,还是有一点点成就感.以下是项目中基本上大致 ...