HLS后端示例
HLS后端示例
TVM支持带有SDAccel的Xilinx FPGA板。这是有关如何将TVM部署到AWS F1 FPGA实例的文档。
此功能仍处于试验阶段。暂时无法使用SDAccel部署端到端神经网络。
本文使用两个python脚本。
- build.py-用于合成FPGA位流的脚本。
- import tvm
- from tvm import te
- tgt_host="llvm"
- tgt="sdaccel"
- n = te.var("n")
- A = te.placeholder((n,), name='A')
- B = te.placeholder((n,), name='B')
- C = te.compute(A.shape, lambda i: A[i] + B[i], name="C")
- s = te.create_schedule(C.op)
- px, x = s[C].split(C.op.axis[0], nparts=1)
- s[C].bind(px, tvm.te.thread_axis("pipeline"))
- fadd = tvm.build(s, [A, B, C], tgt, target_host=tgt_host, name="myadd")
- fadd.save("myadd.o")
- fadd.imported_modules[0].save("myadd.xclbin")
- tvm.contrib.cc.create_shared("myadd.so", ["myadd.o"])
- run.py-使用FPGA作为加速器的脚本。
- import tvm
- import numpy as np
- import os
- tgt="sdaccel"
- fadd = tvm.runtime.load_module("myadd.so")
- if os.environ.get("XCL_EMULATION_MODE"):
- fadd_dev = tvm.runtime.load_module("myadd.xclbin")
- else:
- fadd_dev = tvm.runtime.load_module("myadd.awsxclbin")
- fadd.import_module(fadd_dev)
- ctx = tvm.context(tgt, 0)
- n = 1024
- a = tvm.nd.array(np.random.uniform(size=n).astype("float32"), ctx)
- b = tvm.nd.array(np.random.uniform(size=n).astype("float32"), ctx)
- c = tvm.nd.array(np.zeros(n, dtype="float32"), ctx)
- fadd(a, b, c)
- tvm.testing.assert_allclose(c.asnumpy(), a.asnumpy() + b.asnumpy())
设定
- 使用FPGA Developer AMI启动实例。不需要F1实例进行仿真和综合,因此建议使用成本较低的实例。
- 设置AWS FPGA开发套件工具。
- git clone https://github.com/aws/aws-fpga.git
- cd aws-fpga
- source sdaccel_setup.sh
- source ${XILINX_SDX}/settings64.sh
- 在启用OpenCL的情况下设置TVM。
仿真
- 创建emconfig.json进行仿真。
- emconfigutil --platform ${AWS_PLATFORM} --nd 1
- 将emconfig.json复制到python二进制目录。当前的Xilinx工具包假定主机二进制文件和emconfig.json文件都在同一路径中。
- cp emconfig.json $(dirname $(which python))
- 运行软件仿真
- export XCL_EMULATION_MODE=1
- export XCL_TARGET=sw_emu
- python build.py
- python run.py
- 运行硬件仿真
- export XCL_EMULATION_MODE=1
- export XCL_TARGET=hw_emu
- python build.py
- python run.py
Synthesis
- 使用以下脚本运行综合。
- unset XCL_EMULATION_MODE
- export XCL_TARGET=hw
- python build.py
- 创建AWS FPGA映像并将其上传到AWS S3。
- ${SDACCEL_DIR}/tools/create_sdaccel_afi.sh \
- -xclbin=myadd.xclbin -o=myadd \
- -s3_bucket=<bucket-name> -s3_dcp_key=<dcp-folder-name> \
- -s3_logs_key=<logs-folder-name>
生成awsxclbin文件,对于在F1实例上使用AWS FPGA映像是必需的。
运行
- 启动Amazon EC2 F1实例。
- 将myadd.so,myadd.awsxclbin和run.py复制到F1实例。
- 设置AWS FPGA开发套件。
- git clone https://github.com/aws/aws-fpga.git
- cd aws-fpga
- source sdaccel_setup.sh
- 在启用OpenCL的情况下设置TVM。
- 设置root和setup环境变量。
- sudo sh
- source ${INSTALL_ROOT}/setup.sh
- 运行
python run.py
https://tvm.apache.org/docs/deploy/hls.html
HLS后端示例的更多相关文章
- iView学习笔记(一):Table基本操作(包含前后端示例代码)
iView表格操作 1.前端准备工作 首先新建一个项目,然后引入iView插件,配置好router npm安装iView npm install iview --save cnpm install i ...
- HLS playlist典型示例
[时间:2018-06] [状态:Open] [关键词:流媒体,HLS,m3u8,playlist,variant, alternate] 0 引言 本文主要是对apple官网上的echnical N ...
- Sentry 开发者贡献指南 - 后端服务(Python/Go/Rust/NodeJS)
内容整理自官方开发文档 系列 1 分钟快速使用 Docker 上手最新版 Sentry-CLI - 创建版本 快速使用 Docker 上手 Sentry-CLI - 30 秒上手 Source Map ...
- 视频直播点播nginx-rtmp开发手册中文版
2016年8月18日12:42:35 参照官方文档https://github.com/arut/nginx-rtmp-module/wiki/Directives 请注意这个是粗翻译版,仅供参考,不 ...
- 使用Visual Studio 2012 开发 Html5 应用
Visual Studio 一直以来是开发微软旗下应用的利器,只要是开发微软相关的应用无论是Windows程序,WPF,Asp.Net,WinRT Surface,WindowsPhone 等微软旗下 ...
- C#微信公众号学习 - (一)测试账号申请
主要分为两部分: 1.创建C#的项目,并发布, 2.微信填写发布的地址进行开发者验证. 一. VS环境为VS2017,创建项目时,自带的一些东西发布会导致各种错误,无奈,创建了空项目aspx窗体,如下 ...
- ABP入门教程14 - 更新多语言
点这里进入ABP入门教程目录 设置语种 新增语种 数据库操作 打开多语言表AbpLanguages,添加一条记录. 程序操作 在基础设施层(即JD.CRS.EntityFrameworkCore)的\ ...
- Flask-wtf导入Regexp规则库验证手机号码合法性(测试通过)
手机号码在项目有着很重要的地位,保证用户输入的号码准确无误就显得很关键. 废话不多说,现在页面中引入Regexp规则库: from wtforms.validators import Regexp 验 ...
- OpenWrt Web 开发 LuCI框架 lua语言
LuCI作为“FFLuCI”诞生于2008年3月份,目的是为OpenWrt固件从 Whiterussian 到 Kamikaze实现快速配置接口.Lua是一个小巧的脚本语言,很容易嵌入其它语言.轻量级 ...
随机推荐
- hdu1251 hash或者字典树
题意: 统计难题 Problem Description Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量 ...
- PAT 乙级 -- 1013 -- 数素数
题目简介 令Pi表示第i个素数.现任给两个正整数M <= N <= 104,请输出PM到PN的所有素数. 输入格式: 输入在一行中给出M和N,其间以空格分隔. 输出格式: 输出从PM到PN ...
- Linux-鸟菜-6-文件搜索
Linux-鸟菜-6-文件搜索 which(寻找[执行档]) alian ..............这个后面显示的是别名 没有找到history是因为which是根据PATH环境变阿玲去搜索执行文件 ...
- WM_PAINT 与 WM_ERASEBKGND消息的深入分析
当WM_PAINT消息不是由函数InvalidateRect产生的时(即通过最大话,最小化,移动,下拉菜单等),系统会先产生连续产生若干个WM_ERASEBKGND消息,紧接着在产生WM_PAINT消 ...
- .NET Worker Service 如何优雅退出
上一篇文章中我们了解了 .NET Worker Service 的入门知识[1],今天我们接着介绍一下如何优雅地关闭和退出 Worker Service. Worker 类 从上一篇文章中,我们已经知 ...
- MySQL密码复杂度与密码过期策略介绍
前言: 年底了,你的数据库是不是该巡检了?一般巡检都会关心密码安全问题,比如密码复杂度设置,是否有定期修改等.特别是进行等保评测时,评测机构会要求具备密码安全策略.其实 MySQL 系统本身可以设置密 ...
- 12.26vj训练补题
D.City Day 题意:就是给定n,x,y,以及这n天的下雨量ai,要求这一天的下雨量是这一天前x天到后y天的下雨量中最小的.输出最早的(下标最小的)d.保证答案一定存在 思路:直接遍历寻找就好了 ...
- OO第三单元总结——JML规格
一.JML简介 1.JML语言的理论基础 JML(Java Modeling Language)是用于对Java程序进行规格化设计的一种表示语言.JML是一种行为接口规格语言 (Behavior In ...
- oo——第三单元总结
前言 第三单元是我们学习oo以来第一次接触JML.这一单元的三次作业和以前一样,采用了难度递进的方式,而且前一次作业的设计思路在下一次作业都多多少少有些体现(或者说是在其基础上做出的改进).而且本单元 ...
- 发现数据结构与算法之美的第n次重新学习 ——— 初遇数据结构与算法(了解)
你的数据结构怎么学的?提起数据结构,计算机与软件,it行业内无人不知,无人不晓.但是,当你真正的去通过数据结构与算法内容去实践内容时,真的能联系起来吗?那肯定的 不管是考研还是做项目,数据结构都是必学 ...