MS Batch AI
微软的Batch AI服务是一项新服务,它可以帮助你在GPU pool上训练和测试机器学习模型,包括深度学习模型。它简化了在当前许多流行的深度学习框架(如TensorFlow、Microsoft认知工具包等)上集群创建和模型训练的过程

Ubuntu DSVM 在Batch AI中作为本地VM映像支持的。Ubuntu DSVM预安装有许多深度学习框架、GPU驱动、CUDA和cuDNN组件,所以很容易就可以开始一个深度学习项目

- 数据科学家可以在单个DSVM上使用较小的数据集开发一个模型的初始版本,然后使用 Batch AI 轻松地扩展到多个DSVM和更大的数据集。
- 在Batch AI中使用相同的DSVM映像可以最小化创建集群设置时间,并减少Batch AI和开发环境之间的不兼容性。
- Microsoft Batch AI处理设置集群的细节,可以根据需求自动伸缩,并支持低优先级的vm,以节省额外的成本。
- Microsoft Batch AI还允许您并行地运行参数扫描。
- 管理数据是深度学习的一个重要组成部分,Batch AI包括对文件共享和NFS服务器的本机支持。
What is Batch AI?
BatchAI提供了专门用于人工智能训练和测试的资源管理和作业调度。主要功能包括:
- 运行长期运行的批作业、迭代试验和交互式训练
- 使用GPU或CPU自动或手动缩放VM集群
- 在vm和远程访问之间配置SSH通信
- 支持任何深度学习或机器学习框架,对流行的工具包进行优化配置,比如微软的认知工具包(CNTK)、TensorFlow和Chainer。
- 基于优先级的作业队列以共享集群,并利用低优先级的vm和预留实例
- 灵活的存储选项,包括Azure文件和托管的NFS服务器
- 将远程文件共享到VM和optional container
- 为VM故障提供工作状态和重新启动
- 访问输出日志、stdout、stderr和模型,包括来自Azure存储的流
- Azure命令行界面(CLI),Python、cjava和Java的sdk,在Azure门户中进行监视,以及与Microsoft AI工具的集成
Batch AI SDK支持编写脚本或应用程序来管理training pipelines并与工具集成。SDK目前提供了Python、cjava和REST api。
批处理AI使用Azure资源管理器进行控制操作(创建、列表、get、delete)。Azure Active Directory用于身份验证和基于角色的访问控制。
参考资料
- https://docs.microsoft.com/zh-cn/azure/batch-ai/overview
- https://blogs.msdn.microsoft.com/uk_faculty_connection/2017/11/07/microsofts-batch-ai-service-train-test-machine-learning-models-on-pools-of-gpu-machines/
MS Batch AI的更多相关文章
- AI应用开发实战 - 从零开始搭建macOS开发环境
AI应用开发实战 - 从零开始搭建macOS开发环境 本视频配套的视频教程请访问:https://www.bilibili.com/video/av24368929/ 建议和反馈,请发送到 https ...
- AI应用开发实战
AI应用开发实战 出发点 目前,人工智能在语音.文字.图像的识别与解析领域带来了跨越式的发展,各种框架.算法如雨后春笋一般,互联网上随处可见与机器学习有关的学习资源,各大mooc平台.博客.公开课都推 ...
- Microsoft Visual Studio Tools for AI
https://www.visualstudio.com/zh-hans/downloads/ai-tools-vs/ 开发.调试和部署深度学习和 AI 解决方案 Visual Studio Tool ...
- 学习Tensorflow,反卷积
在深度学习网络结构中,各个层的类别可以分为这几种:卷积层,全连接层,relu层,pool层和反卷积层等.目前,在像素级估计和端对端学习问题中,全卷积网络展现了他的优势,里面有个很重要的层,将卷积后的f ...
- 论文笔记:Dynamic Multimodal Instance Segmentation Guided by Natural Language Queries
Dynamic Multimodal Instance Segmentation Guided by Natural Language Queries 2018-09-18 09:58:50 Pape ...
- pytoch word_language_model 代码阅读
参考代码地址:https://github.com/pytorch/examples/tree/master/word_language_model /word_language_model/data ...
- 如何识别和解决SQL Server中的热闩锁(PAGELATCH_EX)
描述 在SQL Server中,内部闩锁体系结构可在SQL操作期间保护内存.通过页面上的读写操作,可以确保内存结构的一致性.从根本上讲,它具有两个类:缓冲区锁存器和非缓冲区锁存器,它们在SQL Eng ...
- kafka学习笔记(二)kafka的基本使用
概述 第一篇随笔从消息队列的定义和各种应用,以及kafka的分类定义和基本知识,第二篇就写一篇关于kafka的基本实际配置和使用的随笔,包括kafka的集群参数的配置,生产者使用机制,消费者使用机制. ...
- deeplearning.ai 改善深层神经网络 week3 超参数调试、Batch正则化和程序框架 听课笔记
这一周的主体是调参. 1. 超参数:No. 1最重要,No. 2其次,No. 3其次次. No. 1学习率α:最重要的参数.在log取值空间随机采样.例如取值范围是[0.001, 1],r = -4* ...
随机推荐
- VB识别分隔符
strTypeEx = ReadIniFile("Type", "Type", App.Path & "\set.ini") str ...
- SSH防止超时的设置
针对SSH命令工具超时的解决方法: 1.在命令行输入这两行代码,即可完成 echo export TMOUT=1000000 >> /root/.bash_profile cat /roo ...
- C# Windows IPSEC监控(仅此一家,别无分店)
Windows IPSEC监控,使用C#编写,输出为一行字符串,可以按照既有IPSEC规则生成模板 using System; using System.Diagnostics; using Syst ...
- Windows在当前目录打开cmd
/********************************************************************** * Windows在当前目录打开cmd * 说明: * ...
- dubbo AdaptiveExtension
AdaptiveExtension 自适应Extension,作者其实在使用Extension方和Extension之间插入AdaptiveExtension用来自适应,也可以说是适配. 所以,我们发 ...
- ss linux终端配置
最近ss莫名宕机,懒得重新安装了,就安装了一个非gui版本,安装非gui版本还有一个优点就是在远程服务器的时候可以用proxychains进行终端代理,非常友好实用.下面简单的说一下如何进行终端ss ...
- Unity 3D光源-Directional平行光/逆光效果,光晕详解、教程
Unity4大光源之平行光 本文提供全流程,中文翻译. Chinar 坚持将简单的生活方式,带给世人!(拥有更好的阅读体验 -- 高分辨率用户请根据需求调整网页缩放比例) Chinar -- 心分享. ...
- HDU2019数列有序!
Problem Description 有n(n<=100)个整数,已经按照从小到大顺序排列好,现在另外给一个整数x,请将该数插入到序列中,并使新的序列仍然有序. Input 输入数据包含多个测 ...
- Beta周第7次Scrum会议(11/16)【王者荣耀交流协会】
一.小组信息 队名:王者荣耀交流协会 小组成员 队长:高远博 成员:王超,袁玥,任思佳,王磊,王玉玲,冉华 小组照片 二.开会信息 时间:2017/11/16 17:03~17:17,总计14min. ...
- PTA——输出各位数字
PTA 7-37 输出整数各位数字 方法1: #include <stdio.h> #define N 10000 int main(){ long n, temp; ; scanf(&q ...