用TVM在硬件平台上部署深度学习工作负载的端到端 IR 堆栈 深度学习已变得无处不在,不可或缺.这场革命的一部分是由可扩展的深度学习系统推动的,如滕索弗洛.MXNet.咖啡和皮托奇.大多数现有系统针对范围狭窄的服务器级 GPU 进行了优化,需要在其它平台,如移动电话.物联网设备和专用加速器(FPGA.ASIC)上部署大量精力.随着深度学习框架和硬件后端数量的增加,建议建立一个统一的中间表示 (IR) 堆栈,以缩小以生产力为中心的深度学习框架与面向性能或效率的硬件后端之间的差距. TVM 是一个新…
树莓派是国内比较流行的一款卡片式计算机,但是受限于其硬件配置,用树莓派玩深度学习似乎有些艰难.最近OPENAI为嵌入式设备推出了一款AI框架Tengine,其对于配置的要求相比传统框架降低了很多,我尝试着在树莓派上进行了搭建并成功运行了Mobilenet-SSD. Tengine简介 OAID/Tengine|github Tengine 是OPEN AI LAB 为嵌入式设备开发的一个轻量级.高性能并且模块化的引擎. Tengine在嵌入式设备上支持CPU,GPU,DLA/NPU,DSP异构计…
flask部署深度学习模型 作为著名Python web框架之一的Flask,具有简单轻量.灵活.扩展丰富且上手难度低的特点,因此成为了机器学习和深度学习模型上线跑定时任务,提供API的首选框架. 众所周知,Flask默认不支持非阻塞IO的,当请求A还未完成时候,请求B需要等待请求A完成后才能被处理,所以效率非常低.但是线上任务通常需要异步.高并发等需求,本文总结一些在日常使用过程中所常用的技巧. 一.前沿 异步和多线程有什么区别?其实,异步是目的,而多线程是实现这个目的的方法.异步是说,A发起…
CentOS7服务器上部署深度/机器学习环境推荐首选anaconda3,亲测~~ 因为可以创建不同的环境版本或虚拟环境 CentOS7服务器安装anaconda3后,CentOS7服务器开启后自动将anaconda3自身的root(或base)环境开启.用Xshell打开CentOS7服务器后,可以看见 (base) WARNING! The remote SSH server rejected X11 forwarding request.Last login: Tue Mar 12 22:1…
从零开始在ubuntu上配置深度学习开发环境 昨天一不小心把原来配置好的台式机的开发环境破坏了,调了半天没有调回来,索性就重装一次ubuntu系统.这篇文章主要记录一个简单的.‘傻瓜式’教程. 一.Ubuntu系统重装 可以参照以下链接的教程来准备启动盘,然后安装系统,地址为在这里. 二.安装Firefox浏览器 在国内的官网上面下载安装火狐浏览器.首先下载tar文件,如下图: 将压缩包内的文件解压到某一路径之内,博主选择的是解压到:/usr/share/路径下,因为这是ubuntu安装软件的默…
github上热门深度学习项目 项目名 Stars 描述 TensorFlow 29622 使用数据流图进行可扩展机器学习的计算. Caffe 11799 Caffe:深度学习的快速开放框架. [Neural Style](https://github.com/jcjohnson/neural-style) 10148 火炬实现神经风格算法. Deep Dream 9042 深梦. Keras 7502 适用于Python的深度学习库.Convnets,递归神经网络等等.在Theano和Tens…
  这篇博客主要是整理了PointNet提出者祁芮中台介绍PointNet.PointNet++.Frustum PointNets的PPT内容,内容包括如何将点云进行深度学习,如何设计新型的网络架构,如何将架构应用的3D场景理解. 作者主页:https://stanford.edu/~rqi/ B站视频:https://www.bilibili.com/s/video/BV1HE411g7tA PPT下载链接:https://pan.baidu.com/s/105MRbBmCv4Tj6GYTM…
anaconda3.5.2.0----python3.6: conda  install   tensorflow-gpu  -y --prefix  /media/wkr/diskHgst/ubun/env/anaconda3520 conda  install  pytorch  cuda92  -c soumith  -y   --prefix  /media/wkr/diskHgst/ubun/env/anaconda3520 conda  install   -c caffe2 caf…
TVM:一个端到端的用于开发深度学习负载以适应多种硬件平台的IR栈  本文对TVM的论文进行了翻译整理 深度学习如今无处不在且必不可少.这次创新部分得益于可扩展的深度学习系统,比如 TensorFlow.MXNet.Caffe 和 PyTorch.大多数现有系统针对窄范围的服务器级 GPU 进行了优化,并且需要在其他平台(如手机.IoT 设备和专用加速器(FPGA. ASIC))上部署大量工作.随着深度学习框架和硬件后端数量不断增加,我们提出了一个统一的中间表征(IR)堆栈,可以弥补以生产力为中…
如何运行具有奇点的NGC深度学习容器 How to Run NGC Deep Learning Containers with Singularity 高性能计算机和人工智能的融合使新的科学突破成为可能.现在需要在同一个系统上同时部署HPC和AI工作负载. 支持HPC和AI工作负载所需的软件环境的复杂性是巨大的.应用软件依赖于许多相互依赖的软件包.仅仅获得一个成功的构建是一个挑战,更不用说确保构建得到优化,以利用最新的硬件和软件功能. 容器是一种广泛采用的降低HPC和AI软件部署复杂性的方法.整…