论文阅读:NETFPGA SUME: TOWARD 100 GBPS AS RESEARCH COMMODITY
摘要:
数据中心网络的需求增长意味着许多组成技术不在研究社区的预算之内。 NETFPGA SUME是基于FPGA的PCI Express板,具有I / O功能,可作为网络接口卡,多端口开关,防火墙或测试和测量环境进行Gbps的操作。 NETFPGA SUME提供了可行的开发环境,既可以重用现有的代码库,又可以启用新的设计。
背景/问题:
数据中心的增长促使采用更快的网络,刺激数据中心内更多计算机的连接,并激发新的网络管理方法。带宽聚合超过100 Gbps到数十Tbps的情况,甚至对于中等程度的机器互连也越来越普遍,灵活、可扩展和可管理的数据中心互连甚至迫使基本链路速率远远超过100 Gbps。因此,基本网络基础结构也被推到了100 Gbps以上,这样的进步为研发Web负载平衡和拒绝服务防御、最小长度的数据包以100 Gbps线速进行入侵检测以及100 Gbps网络测试和捕获带来了挑战。
即使是像OpenFlow这样的灵活交换系统,其后代也将需要适应以100 Gbps端口速度进行常规操作,随着主机板适配器(HBA)扩展到100 Gbps以上,计算挑战也出现了。
实际上,研究人员必须原型化新想法,无论是以100 Gbps的速度查找或分类算法,还是使用性能超过100 Gbps的原型平台在部署中测试更大的结构。为了提供新一代设计,研究人员必须以与现代数据中心部署相当的速度和规模来设计,制造和评估原型。
高速数据中心互连的实际研究社区经验是有限的,通常是由费用引起的,但也受到商品系统的功能和灵活性的限制。研究人员可以选择两种途径:他们可以从少量可重新编程的商品高速硬件产品中进行选择,这些产品是从头开始构建的或提供有限的重用性;或者他们可以使用开源系统,从而实现更大的协作和更高质量的研究,并具有可复制的已发表结果
解决方法:
NetFPGA项目作为开源项目已取得成功。除了简化协作之外,开源还可以加快设计过程,并允许采用可靠的研究方法,从而可以在更广泛的社区中实现可重复性和思想的直接比较。尽管开源软件已成为事实上的标准,但包括硬件在内的完整开源平台仍然稀缺,尤其是对于高带宽解决方案而言。
我们引入了一个新的NetFPGA开源平台——NetFPGA SUME:它的硬件是10 Gbps和40 Gbps应用快速原型制作的理想解决方案,并且是100 Gbps应用的技术支持者,重点关注带宽和吞吐量。它基于Virtex-7现场可编程门阵列(FPGA),以及支持高端设计的外设——PCI Express(PCIe)Gen.3,多个存储器接口和高速扩展接口。
从一开始,该卡旨在为研究和学术界提供适用于各种研究的低成本商品设备,用户可以利用该平台的现有开放源代码设计,并且可以替换任何参考设计中的大部分或最少内容,或者以其他用户的贡献项目为基础。我们讨论了用例,解释了NetFPGA SUME如何在每种情况下提供适当的资源,并比较了几种当前基于FPGA的解决方案,显示了它们在这些方面的优势。
实现细节:
解决方案的背景是NetFPGA项目,该项目提供软件、硬件和社区作为基本基础结构,以简化设计、仿真和测试,并围绕一个开源高速网络平台进行。当前的NetFPGA工作已通过LGPL 2.1许可。除了硬件和软件,NetFPGA项目还得到社区资源的支持,这些资源包括在线论坛、教程、夏令营活动和开发人员研讨会,所有这些均由NetFPGA项目团队提供支持。由于在NetFPGA项目下开发的所有参考项目都是开源的,因此用户可以在项目之间重用构建基块,并比较设计利用率和性能。所有NetFPGA发行版中都包含的参考项目是NIC,交换机和IPv4路由器。过去的经验表明,社区成员会定期增强和重新分配参考和贡献的NetFPGA项目,从而促进良性循环。
NetFPGA SUME:高级架构NetFPGA SUME设计旨在创建一种低成本的PCIe主机适配器卡,该卡可支持40 Gbps和100 Gbps应用。

NetFPGA SUME使用大型FPGA,支持两种标准接口(SFPþ)中提供的10 Gbps或更高的高速串行接口,并且格式允许用户轻松扩展。我们工作的结果就是NetFPGA SUME(见上图a),该板是Digilent生产的具有大型FPGA架构的PCIe适配卡。
该板的核心是Xilinx Virtex-7 690T FPGA器件,五个外围子系统补充了FPGA:
高速串行接口子系统包含30个串行链路,其运行速度高达13.1 Gbps。它们将四个10 GbpsSFPþ以太网接口,两个扩展连接器和一个PCIe边缘连接器直接连接到FPGA。
PCIe 3.0子系统用于在卡和主机设备之间建立接口,从而允许寄存器访问和平台与主板之间的数据包传输。
内存子系统结合了SRAM和DRAM设备:SRAM由三个以500 MHz运行的36位QDRII器件设计而成,DRAM包括两个以933 MHz(1866 MT / s)运行的64位DDR3内存模块。
存储子系统允许通过两个串行高级技术附件(SATA)接口同时使用MicroSD卡和外部磁盘。
FPGA配置子系统与Flash设备的使用有关,NetFPGA SUME的其他功能支持调试,扩展和同步电路板。
图b显示了该板的框图:该板卡实现为双插槽,全尺寸PCIe适配器,可以作为PCIe主机外部的独立单元运行。
讨论:
SUME是使用基于FPGA的平台来提供灵活性,表1列出了几种基于FPGA的以网络为中心的平台。

尽管商业平台的价格很高,从5,000美元到8,000美元不等,但通过大学会员计划的董事会价格通常不到2,000美元。 如表所示,NetFPGA SUME具有最高端的功能——尽管VC709使用与NetFPGA SUME板相同的FPGA和相同的DRAM接口,但它是非标准尺寸,缺少SRAM接口,并且存储容量有限。 DE5-Net板具有与NetFPGA SUME类似的DRAM访问功能,但是功能集不灵活,没有其他扩展选项。
NetFPGA SUME板具有比任何参考板更多的高速串行接口,使其非常适合高带宽设计。
设想,NetFPGA SUME可以用于研究和教育,可以提供一个平台,以便在适当的情况下快速制作原型,甚至进行有用的部署。
论文阅读:NETFPGA SUME: TOWARD 100 GBPS AS RESEARCH COMMODITY的更多相关文章
- 论文阅读 | Region Proposal by Guided Anchoring
论文阅读 | Region Proposal by Guided Anchoring 相关链接 论文地址:https://arxiv.org/abs/1901.03278 概述 众所周知,anchor ...
- 论文阅读:Face Recognition: From Traditional to Deep Learning Methods 《人脸识别综述:从传统方法到深度学习》
论文阅读:Face Recognition: From Traditional to Deep Learning Methods <人脸识别综述:从传统方法到深度学习> 一.引 ...
- 论文阅读:《Bag of Tricks for Efficient Text Classification》
论文阅读:<Bag of Tricks for Efficient Text Classification> 2018-04-25 11:22:29 卓寿杰_SoulJoy 阅读数 954 ...
- YOLO 论文阅读
YOLO(You Only Look Once)是一个流行的目标检测方法,和Faster RCNN等state of the art方法比起来,主打检测速度快.截止到目前为止(2017年2月初),YO ...
- [论文阅读]阿里DIEN深度兴趣进化网络之总体解读
[论文阅读]阿里DIEN深度兴趣进化网络之总体解读 目录 [论文阅读]阿里DIEN深度兴趣进化网络之总体解读 0x00 摘要 0x01论文概要 1.1 文章信息 1.2 基本观点 1.2.1 DIN的 ...
- [论文阅读] RNN 在阿里DIEN中的应用
[论文阅读] RNN 在阿里DIEN中的应用 0x00 摘要 本文基于阿里推荐DIEN代码,梳理了下RNN一些概念,以及TensorFlow中的部分源码.本博客旨在帮助小伙伴们详细了解每一步骤以及为什 ...
- Action4D:人群和杂物中的在线动作识别:CVPR209论文阅读
Action4D:人群和杂物中的在线动作识别:CVPR209论文阅读 Action4D: Online Action Recognition in the Crowd and Clutter 论文链接 ...
- [论文阅读] ALM-HCS(高对比场景自适应对数映射)
[论文阅读] ALM-HCS(高对比场景自适应对数映射) 文章: Adaptive Logarithmic Mapping for Displaying High Contrast Scenes 1. ...
- 论文阅读(Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition)
白翔的CRNN论文阅读 1. 论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Seq ...
随机推荐
- 【Bell-Ford 算法】CLRS Exercise 24.1-4,24.1-6
本文是一篇笔记,大部分内容取自 CLRS 第三版,第 24.1 节. Exercise 24.1-4 Modify the Bellman-Ford algorithm so that it sets ...
- 【一道来自老师的题的题解】equip——奇妙的最短路
这道题真的第一眼完全想不到是最短路啊!!!!!!!! 感谢DR大佬讲解!!!!!90°鞠躬 =u= 暂时没有评测网址,(因为需要special judge)敬请期待 机房另一大佬JYY题解,可以对比参 ...
- Git 实习一个月恍然大悟合集
从开始实习到现在大概有一个月了,这个月时间接触了很多新东西,其中就包括了git版本控制.分支管理等等.我在这段时间里,深深地感受到了git对公司项目代码管理和控制.团队合作带来的益处和其重要性.其实在 ...
- 从入门到自闭之Python软件命名规范
软件命名规范:分文件存储 当代码存放在一个py文件中时会存在一下缺点: 不便于管理 可读性差 加载速度慢 是Django的雏形 程序员预定俗称的一些东西 启动文件:也叫启动接口,通常文件夹名字使用bi ...
- CE修改器使用教程 [入门篇]
Cheat Engine 一般简称CE,是一个开放源代码的作弊软件,其功能包括:内存扫描.十六进制编辑器.调试工具,Cheat Engine 自身附带了外挂制作工具,可以用它直接生成外挂工具,CE可以 ...
- hadoop批量命令脚本xcall.sh及jps找不到命令解决
1.xcall.sh批量命令脚本: #!/bin/bash params=$@ i=128 for (( i=128 ; i <= 131 ; i = $i + 1 )) ; do echo = ...
- Git 一般性操作
git全局设定 git config --global user.name “码云账号” git config --global user.email “码云注册邮箱” git 定位文件夹cd进入到需 ...
- spring boot入门与进阶教程
SpringBoot入门.SpringBoot进阶.Spring Cloud微服务.Spring Ecosystem 微服务相关.Spring Boot 入门 IDEA 版本.Spring Boot集 ...
- 14 Scrapy中selenium的应用
在通过scrapy框架进行某些网站数据爬取的时候,往往会碰到页面动态数据加载的情况发生,如果直接使用scrapy对其url发请求,是绝对获取不到那部分动态加载出来的数据值.但是通过观察我们会发现,通过 ...
- 关于ES5中的prototype与ES6中class继承的比较
ES5:继承: 1.ES5:继承 通过原型链实现继承.子类的prototype为父类对象的一个实例,因此子类的原型对象包含指向父类的原型对象的指针,父类的实例属性成为子类原型属性 2.ES6 的继承 ...