端到端TVM编译器(下) 4.3 Tensorization DL工作负载具有很高的运算强度,通常可以分解为张量运算符,如矩阵乘法或一维卷积.这些自然分解导致了最近的添加张量计算原语.这些新的原语带来了机遇和挑战调度:为了 提高性能,编译框架必须无缝集成.称之为张量化:类似于SIMD体系结构的矢量化,但是 有显著差异.指令输入是多维的,具有固定或可变的长度,每个输入都有不同的数据布局.更重要的是,不能支持一组固定的原语,因为新的加速器是张量指令变体. 需要一个可扩展的解决方案.通过分离张量内在声…