【TVM模型编译】2. relay算子构造.md

从TVM的官方Tutorial里面，介绍了如何新增自定义算子。(这是我翻译的)

之前的文章讲到了onnx 算子转换到Relay IR的过程

下面以Conv2d算子介绍，编译过程中 Relay IR是如何被调用的。

relay 算子调用

上面的get_relay_op实际上是查找所有 relay ir算子，其代码在python/tvm/relay/frontend/common.py中的get_relay_op。继续以conv卷积算子为例介绍。上文所述的转换算子中，有下面的语句

for candidate in (_op, _op.nn, _op.image, _op.vision, _op.contrib):

    op = getattr(candidate, op_name, None)

    if op is not None:

        break

对于conv2d算子，在_op.nn中，找到conv2d实现。

def conv2d(

    data,

    weight,

    strides=(1, 1),

    padding=(0, 0),

    dilation=(1, 1),

    groups=1,

    channels=None,

    kernel_size=None,

    data_layout="NCHW",

    kernel_layout="OIHW",

    out_layout="",

    out_dtype="",

):

    if isinstance(kernel_size, int):

        kernel_size = (kernel_size, kernel_size)

    if isinstance(strides, int):

        strides = (strides, strides)

    if isinstance(dilation, int):

        dilation = (dilation, dilation)

    padding = get_pad_tuple2d(padding)

    return _make.conv2d( data, weight, strides, padding, dilation, groups, channels, kernel_size, data_layout, kernel_layout, out_layout, out_dtype,

    )

这里的_make.conv2d是通过下面的PackFunc注册得到的

tvm._ffi._init_api("relay.op.nn._make", __name__)

在src/relay/op/nn/convolution.cc找到conv2d的注册函数

TVM_REGISTER_GLOBAL("relay.op.nn._make.conv2d")

    .set_body_typed([](Expr data, Expr weight, Array<IndexExpr> strides, Array<IndexExpr> padding,

                       Array<IndexExpr> dilation, int groups, IndexExpr channels,

                       Array<IndexExpr> kernel_size, String data_layout, String kernel_layout,

                       String out_layout, DataType out_dtype) {

      return MakeConv<Conv2DAttrs>(data, weight, strides, padding, dilation, groups, channels,

                                   kernel_size, data_layout, kernel_layout, out_layout, out_dtype,

                                   "nn.conv2d");

    });

MakeConv 是对所有卷积的模板，根据参数实例化相应的函数

template <typename T>

inline Expr MakeConv(Expr data, Expr weight, Array<IndexExpr> strides, Array<IndexExpr> padding,

                     Array<IndexExpr> dilation, int groups, IndexExpr channels,

                     Array<IndexExpr> kernel_size, std::string data_layout,

                     std::string kernel_layout, std::string out_layout, DataType out_dtype,

                     std::string op_name) {

  auto attrs = make_object<T>();

  attrs->strides = std::move(strides);

  attrs->padding = std::move(padding);

  attrs->dilation = std::move(dilation);

  attrs->groups = groups;

  attrs->channels = std::move(channels);

  attrs->kernel_size = std::move(kernel_size);

  attrs->data_layout = std::move(data_layout);

  attrs->kernel_layout = std::move(kernel_layout);

  attrs->out_layout = std::move(out_layout);

  attrs->out_dtype = std::move(out_dtype);

  const Op& op = Op::Get(op_name);

  return Call(op, {data, weight}, Attrs(attrs), {});

}

这里通过Op::Get(op_name); 获取对应relay算子，在Op::Get函数中发现是通过查表得到。

// find operator by name

const Op& Op::Get(const String& name) {

  const OpRegEntry* reg = OpRegistry::Global()->Get(name);

  ICHECK(reg != nullptr) << "AttributeError: Operator " << name << " is not registered";

  return reg->op();

}

注册是通过C++的RELAY_REGISTER_OP("nn.conv2d")宏注册到OpRegistry::Global()中。宏展开为

static __attribute__((unused))::tvm::OpRegEntry& __make_Op230 =

    ::tvm::OpRegEntry::RegisterOrGet("nn.conv2d").set_name()

注册过程：

RELAY_REGISTER_OP("nn.conv2d")

    .describe(R"code(2D convolution layer (e.g. spatial convolution over images).

This layer creates a convolution kernel that is convolved

with the layer input to produce a tensor of outputs.

- **data**: This depends on the `layout` parameter. Input is 4D array of shape

            (batch_size, in_channels, height, width) if `layout` is `NCHW`.

- **weight**: (channels, in_channels, kernel_size[0], kernel_size[1])

- **out**:  This depends on the `layout` parameter. Output is 4D array of shape

            (batch_size, channels, out_height, out_width) if `layout` is `NCHW`.

)code" TVM_ADD_FILELINE)

    .set_attrs_type<Conv2DAttrs>()

    .set_num_inputs(2)

    .add_argument("data", "Tensor", "The input tensor.")

    .add_argument("weight", "Tensor", "The weight tensor.")

    .set_support_level(2)

    .add_type_rel("Conv2D", Conv2DRel<Conv2DAttrs>)

    .set_attr<FInferCorrectLayout>("FInferCorrectLayout", ConvInferCorrectLayout<Conv2DAttrs>);

返回的是OpRegEntry，后续的set_name等，则是通过OpRegEntry的get接口（返回的是OpNode），构造对应的Relay op

【TVM模型编译】2. relay算子构造.md的更多相关文章

TVM将深度学习模型编译为WebGL
使用TVM将深度学习模型编译为WebGL TVM带有全新的OpenGL / WebGL后端! OpenGL / WebGL后端 TVM已经瞄准了涵盖各种平台的大量后端:CPU,GPU,移动设备等.这次 ...
【KAWAKO】TVM-tflite模型编译与优化
目录前言准备模型版本问题精度问题加载tflite模型编译模型在python上运行模型进行测试加载输入数据运行四连优化(Autotune) 注: 前言 TVM的编译与优化主要有两种方 ...
- 反编译 AndroidKiller 逆向实践案例 MD
目录目录反编译 AndroidKiller 逆向实践案例 MD AndroidKiller 简介插件升级基本使用实践案例修改清单文件打印 debug 级别的日志方式一:直接代理 Lo ...
TVM优化Deep Learning GPU算子
TVM优化Deep Learning GPU算子高效的深度学习算子是深度学习系统的核心.通常,这些算子很难优化,需要HPC专家付出巨大的努力. 端到端张量IR / DSL堆栈TVM使这一过程变得更加 ...
MACE(2)-----模型编译
作者:十岁的小男孩 QQ:929994365 无用本文仅用于学习研究,非商业用途,欢迎大家指出错误一起学习,文章内容翻译自 MACE 官方手册,记录本人阅读与开发过程,力求不失原意,但推荐阅读原文. ...
Win 10环境下6sV2.1模型编译心得
最新版本6sV2.1模型是通过FORTRAN95编写的,2017年11月代码编写完成,2018年11月发布在模型官网上.通常我们在使用过程中都是调用模型的.exe可执行文件,而下载下来的是FORTRA ...
opencv编译静态库时选择MD模式无效的原因
在Cmake-gui上看到的明明是MD运行库依赖,生成MS项目时却变成了MT运行库依赖. 原因在于编译静态库时内部做了自动替换.
TVM部署预定义模型
TVM部署预定义模型本文通过深度学习框架量化的模型加载到TVM中.预量化的模型导入是在TVM中提供的量化支持之一. 本文演示如何加载和运行由PyTorch,MXNet和TFLite量化的模型.加载后 ...
字节码反编译 APKTool 重新打jar包 MD
Markdown版本笔记我的GitHub首页我的博客我的微信我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
keras channels_last、preprocess_input、全连接层Dense、SGD优化器、模型及编译
channels_last 和 channels_first keras中 channels_last 和 channels_first 用来设定数据的维度顺序(image_data_format). ...

随机推荐

最新centos7 部署 k8s v1.26，简单易懂，跟着命令敲就完事
其实没什么好说的,搭环境搞了一整天,人已经麻了,踩了很多坑,网上教程的版本大都比较旧,总是和最新版本各种地方不兼容,把坑踩完了,k8s目前最新的版本是v1.26,跟着命令敲就行了,我已经重复部署了很多 ...
Python之进程管理
使用python创建进程 from multiprocessing import Process # 导入进程模块 import time # 定义一个函数,测试创建进程使用 def task(nam ...
[Linux]Linux执行sh脚本时，出现$‘\r‘: command not found（未找到命令）"错误的解决方案[转载]
1 文由为什么要把这么一个看似很简单的问题,还要以[转载]的方式专门用博客写出来? 主要是在编写crontab的自动化定时脚本的过程中,发现是这个错导致的自动化脚本频繁执行异常时,已经花了好几个小时 ...
[Linux]U盘启动盘安装CentOS7系统(LiveGNOME版)
1 准备:工具 U盘容量:视CentOS具体版本需要而定.推荐4G+ UltraISO(软碟通) ISO制作工具 / U盘启动盘刻录工具 2 制作:U盘启动盘 step1 下载CentOS镜像 Ce ...
随机模块random os模块序列化模块
random: 验证码的实现: choice是选择列表中任意一个 ##记得把randint取出来的数字转化成str类型,要不就会相加 ##cha()是把asc编码表里的数字转化成字符更进一步做成函数 ...
oracle删除一张表后，索引，同义词，视图，约束会被删除么
问题描述:看到有一道题,说删除一张表之后,什么会被关联删除进行测试,看看一张表什么会被关联删除,进行scoot下的EMP进行测试一.创建测试需求用例表结构: SQL> desc emp; ...
python对图片进行最大边大小缩放
def split_image_bs4(file, max_len=720): """ 切割图片 :param file: 二进制文件 :param max_len: 最 ...
c# 异步进阶———— paralel [二]
前言简单整理一下paralel,以上是并行的意思. 正文我们在工作中常常使用task await 和 async,也就是将线程池进行了封装,那么还有一些更高级的应用. 是对task的封装,那么来看 ...
Java并发(三)----创建线程的三种方式及查看进程线程
一.直接使用 Thread // 创建线程对象 Thread t = new Thread() { public void run() { // 要执行的任务 } }; // ...
linux高级编程之线程间的通信（pthread_cleanup_push和pthread_cleanup_pop）
linux高级编程之线程间的通信(pthread_cleanup_push和pthread_cleanup_pop) 线程可以安排他退出时需要调用的函数,这与进程可以用atexit函数安排进程退出时需 ...

【TVM模型编译】2. relay算子构造.md

relay 算子调用

【TVM模型编译】2. relay算子构造.md的更多相关文章

随机推荐

热门专题