题目:深度学习框架“计图”的创新与探索

报告人:胡事民

报告人简介:胡事民,清华大学计算机系教授,主要研究方向为计算机图形学、虚拟现实、智能信息处理和系统软件等。

报告简介:深度学习框架是现代人工智能算法开发和应用的基本支撑框架,自主可控的深度学习框架是推动中国人工智能更好发展的必然要求。国外主流深度学习框架基于开源开放的生态环境,已经构建起了完整的产业链和庞大用户群体。计图是国内首个由高校主导的开源深度学习框架。计图基于所提出的“统一计算图”,创新地使用了元算子融合和动态编译技术,目前在多种任务性能上超越国外主流平台。除此之外,计图框架还在易用性、灵活性以及模型算法覆盖度上做了大量改进,旨在降低用户学习成本,吸引更多用户,构建自己的开源深度学习生态。本报告拟介绍计图(Jittor)平台的整体架构和多项创新技术,分享计图框架的开源历程和发展思路,并探讨中国开源深度学习框架的未来发展。

  • 机器学习框架(平台)是人工智能的核心技术

    • 负责机器学习模型的训练和推理
    • 管理着人工智能应用所需要的大规模数据和模型
    • 负责底层计算设备调度以及资源申请

  • 机器学习平台的难度在哪里?

    • 对机器学习算法的深刻理解
    • 对图形图像应用的精准把握
    • 对底层系统软件的巧妙应用

  • 创新点一:统一计算图

    • 结合静态图高效和动态图易用的特点

      • 静态图(TensorFlow):一次性把全图发送到计算设备上运行
      • 动态图(Pytorch):将算子动态地发送到计算设备上运行
    • 动态切分 => 静态子图,静态子图做优化
    • 统一计算图是完成了多种统一的计算图
      • 统一动态图和静态图,易用、同时高效
      • 统一管理前向反向图,支持高阶导数
      • 统一管理CPU-GPU内存,突破GPU显存限制
      • 统一同步异步运行接口,使得数据读取,内存拷贝,模型计算可以同时进行,提升性能
      • 统一管理多次迭代的计算图,使得框架可以实现跨迭代的融合优化
  • 创新点二:18个元算子、元算子融合

    • Tensorflow算子数量: 2000+,PyTorch算子数量: 700+;庞大的算子库维护,

      优化困难
    • 将三类元算子(重索引、重索引化简、元素级)进行融合形成深度学习所需要的算子
      • 重索引算子(一对多)——广播、填补、切分
      • 重索引化简算子(多对一)——累乘、累加、取均值
      • 元素级算子(一对一)
    • 元算子是反向传播闭包(元算子的反向传播也是元算子)
      • 在反向传播过程中,算子可自动对应生成,重索引算子—重索引化简算子、元素级算子—元素级算子
    • 元算子可以覆盖绝大多数深度学习算子,对于元算子无法覆盖的算子,计图提供Code算子(Python中内联C++代码),完成100%算子覆盖
  • 6 大特色

    • 动态编译

      • 内置的元算子编译器,可将Python代码动态编译高性能C++代码
      • 内置LLVM兼容的优化编译遍(Pass),根据硬件设备,自动优化动态编译的代码
    • 统一内存
      • 将显存和CPU内存统一,当深度学习模型将显存耗尽时,将使用CPU内存来弥补。
    • 骨干网络
      • 已经支持的骨干网络:AlexNet;VGG;ResNet;SqueezeNet;Incept ion;Goog leNet;Shuff leNet;Mobi leNet;MnasNet;Res2Net
    • 模型库
      • 2020年将发布27中主流GAN、语义分割、检测库、3D点云库、3D网格库等
    • 模型转换
      • 提供工具可以将Pytorch代码一键转码为Jittor
    • 分布式
      • 无需修改训练代码,只需修改启动命令;自动数据并行,实现多卡训练。
  • 最新进展

    • Res2Net、PointNet++,DeepFaceDrawing
  • 图形学新的机遇

    • 可微编程(可微光栅化渲染、可微蒙特卡洛光线追踪、可微物理模拟)

CAD& CG 2020 胡事民教授—开源框架Jittor的创新与探索的更多相关文章

  1. 计算机图形学 opengl版本 第三版------胡事民 第四章 图形学中的向量工具

    计算机图形学 opengl版本 第三版------胡事民 第四章  图形学中的向量工具 一   基础 1:向量分析和变换   两个工具  可以设计出各种几何对象 点和向量基于坐标系定义 拇指指向z轴正 ...

  2. 计算机图形学 opengl版本 第三版------胡事民 第三章更多的绘图工具

    opengl  计算机图形学 第三版   第二部分   第三章更多的绘图工具 3.1   概述 第2章中  我们绘图使用的是屏幕窗口的基础坐标系    以像素为单位 屏幕坐标从左下角x从0延伸到scr ...

  3. “开源、共享、创新” 2020 中国.NET开发者大会小结

    大会的新闻稿在2020年12月31日正式发布:开源·共享·创新|2020年中国.NET开发者大会圆满收官! , 本文是这篇新闻的补充性文章,仅代表个人对大会的各方面分享内容的一个小结. 在2019年上 ...

  4. CVPR 2020目标跟踪多篇开源论文(上)

    CVPR 2020目标跟踪多篇开源论文(上) 1. SiamBAN:面向目标跟踪的Siamese Box自适应网络 作者团队:华侨大学&中科院&哈工大&鹏城实验室&厦门 ...

  5. CVPR 2020目标跟踪多篇开源论文(下)

    CVPR 2020目标跟踪多篇开源论文(下) 6. Cooling-Shrinking Attack: Blinding the Tracker with Imperceptible Noises 作 ...

  6. Pyhton开源框架(加强版)

    info:Djangourl:https://www.oschina.net/p/djangodetail: Django 是 Python 编程语言驱动的一个开源模型-视图-控制器(MVC)风格的 ...

  7. Python开源框架

    info:更多Django信息url:https://www.oschina.net/p/djangodetail: Django 是 Python 编程语言驱动的一个开源模型-视图-控制器(MVC) ...

  8. 【安卓网络请求开源框架Volley源码解析系列】定制自己的Request请求及Volley框架源码剖析

    通过前面的学习我们已经掌握了Volley的基本用法,没看过的建议大家先去阅读我的博文[安卓网络请求开源框架Volley源码解析系列]初识Volley及其基本用法.如StringRequest用来请求一 ...

  9. Android开源框架Afinal第一篇——揭开圣女的面纱

    Android开源框架Afinal第一篇——揭开圣女的面纱 分类: Android开源框架哪点事2013-09-02 14:25 260人阅读 评论(0) 收藏 举报 Afinal 这是Afinal在 ...

随机推荐

  1. 洛谷 P4093 [HEOI2016/TJOI2016]序列 CDQ分治优化DP

    洛谷 P4093 [HEOI2016/TJOI2016]序列 CDQ分治优化DP 题目描述 佳媛姐姐过生日的时候,她的小伙伴从某宝上买了一个有趣的玩具送给他. 玩具上有一个数列,数列中某些项的值可能会 ...

  2. Linux平台Zabbix Agent的安装配置

    这里简单总结一下Linux平台Zabbix Agent的安装配置,实验测试的Zabbix版本比较老了(Zabbix 3.0.9),不过版本虽然有点老旧,但是新旧版本的安装步骤.流程基本差别不大.这里的 ...

  3. leetcode刷题-73矩阵置零

    题目 给定一个 m x n 的矩阵,如果一个元素为 0,则将其所在行和列的所有元素都设为 0.请使用原地算法. 示例 1: 输入: [  [1,1,1],  [1,0,1],  [1,1,1]]输出: ...

  4. 购书网站前端实现(HTML+CSS+JavaScript)

    购书+阅读静态网页设计与实现 一.主页设计HTML 1.效果展示及实现 2.完整代码 二.主页样式布局CSS 三.空间功能实现Javascript 主要功能 Javascript完整代码: 总结 购书 ...

  5. oracle之WHERE子句中常用的运算符

    WHERE子句中常用的运算符 4.1 运算符及优先级: 算数运算符*,/,+,-, 逻辑运算符not, and ,or 比较运算符 单行比较运算 =,>, >=,<,<=, & ...

  6. spring mvc(1) 为什么要使用mvc

    在使用spring mvc之前,我们首先要理解我们为什么要使用spring mvc.关于这个问题我们可以看一下java web的简单发展过程. 1. servlet 开发阶段 上世纪90年代,随着In ...

  7. hystrix文档翻译之如何使用

    Hello World! 使用HystrixCommand实现“Hello World”. public class CommandHelloWorld extends HystrixCommand& ...

  8. 1.KafKa-介绍

  9. 从Class源码看反射

    日常敲码中,如果想要在程序运行阶段访问某个类的所有信息,并支持修改类的状态或者行为的话,肯定会用到反射,而反射靠的就是Class类.Java的动态代理也用到了这个东西,所以了解其基本操作在苦逼的CRU ...

  10. 趣图:普通人讲故事 VS 程序员讲故事

      扩展阅读 趣图:我说自己菜 vs 大佬说自己菜 趣图:客户需求VS客户预算 趣图:在外行人眼中的程序员 如何处理前任程序员留下的代码 一个故事讲清楚NIO