避免关注底层硬件，Nvidia将机器学习与GPU绑定

Nvidia释放的一组cuDNN的库，有效的实现了其与多种深度学习框架的整合。基于cuDNN，加速了代码的运行，同时让研究员避免去关心底层硬件性能。

原文链接：http://www.efficient-it.com.cn/viewnews/itemid/30996.html

近日，通过释放一组名为cuDNN的库，Nvidia将GPU与机器学习联系的更加紧密。据悉，cuDNN可以与当下的流行深度学习框架直接整合。Nvidia承诺，cuDNN可以帮助用户更加聚焦深度神经网络，避免在硬件性能优化上的苦工。

当下，深度学习已经被越来越多的大型网络公司、研究员，甚至是创业公司用于提升AI能力，代表性的有计算机视觉、文本检索及语音识别。而包括计算机视觉等流行的领域都使用了图形处理单元(GPU)，因为每个GPU都包含了上千的核心，它们可以加快计算密集型算法。

通过Nvidia了解到，cuDNN基于该公司的CUDA并行编程语言，可以在不涉及到模型的情况下与多种深度学习框架整合。Nvidia的一位发言人透露了更多消息：

通过在Caffe、Theano、Torch7等主流机器学习框架上的研究，cuDNN允许研究员可以在这些框架上无缝利用GPU的能力，并预留了未来的发展空间。举个例子：在Caffe中整合cuDNN对终端用户是不可见，只需要非常简单的设置就可以完成这个操作，即插即用是cuDNN的核心设计因素。

从更技术的角度看，cuDNN是一个低等级的库，无需任何CUDA代码就可以在host-code中调用，非常类似我们已经开发的CUDA cuBLAS和cuFFT库。通过cuDNN，用户不必再关心以往深度学习系统中的底层优化，他们可以将注意力集中在更高级的机器学习问题，推动机器学习的发展。同时基于cuDNN，代码将以更快的速度运行。

不管是为了未来增长，还是“GPU不只用于计算机图形渲染”这个长期目标，Nvidia在拥抱深度学习和机器学习上非常积极。当下GPU的使用已经非常广泛，机构使用它代替CPU以获得更高的速度及更低的成本。

但是，仍然存在一些特定的因素抑制了CPU的长期发展。其中一个就是替代架构，比如IBM的SyNAPSE和类似Nervana Systems一些初创公司的努力，比如，它们专门为神经网络和机器学习负载设计。另一个则是现有的处理器架构，包括CPUs和FPGAs已经让人们看到了未来机器学习负载上的能力。

虽然当下已经有很多云供应商通过服务的形式提供了深度学习能力，但是机器深度学习离进入主流仍然有很大的距离。

避免关注底层硬件，Nvidia将机器学习与GPU绑定的更多相关文章

nodejs操作arduino入门（javascript操作底层硬件）
用Javascript来操作硬件早就不是一件稀奇的事情了. 所以作为一名电子专业出身的FE,我也打算尝试一下用js来驱动arduino: 要想操作这些底层硬件,肯定是需要一些工具的,我这里介绍的工具主 ...
NVIDIA Jarvis：一个GPU加速对话人工智能应用的框架
NVIDIA Jarvis:一个GPU加速对话人工智能应用的框架 Introducing NVIDIA Jarvis: A Framework for GPU-Accelerated Conversa ...
Android音频输入通道的底层硬件和软件开发分析
Android潜在的发展音频输入通道的软硬件分析我们都知道耳机Mic集成在一直的那种四段耳机Mic插头是Android设备上比較经常使用.可是也会有分开的情况,比較假设在普通的PC机中装Androi ...
nvidia Compute Capability（GPU）
GPU Compute Capability NVIDIA TITAN X 6.1 GeForce GTX 1080 6.1 GeForce GTX 1070 6.1 GeForce GTX 1060 ...
Ubuntu16.04安装NVIDIA驱动、实现GPU加速
NVIDIA驱动前前后后装了好几遍,下面把个人的经验分享下,大家仅供参考. 老规矩,先引用师兄的(最详细)https://blog.csdn.net/sinat_23853639/article/de ...
机器人程序设计——之如何正确入门ROS | 硬创公开课（附视频/PPT）【转】
转自:http://blog.exbot.net/archives/2966 导语:本期公开课面向想入手ROS却又不知从何下手的小伙伴,为大家梳理好学习思路. ROS和Android一样是开源的,功能 ...
由浅入深SCF无服务器云函数实践
欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 作者:陈杰,腾讯云架构平台部技术专家近年来,互联网服务从一开始的物理服务器托管,虚拟机,容器,发展到现在的云函数,逐步无服务器化,如下表所示. ...
Linux C高级编程——文件操作之系统调用
Linux C高级编程文件操作之系统调用宗旨:技术的学习是有限的,分享的精神是无限的. 库函数是一些完毕特定功能的函数.一般由某个标准组织制作公布,并形成一定的标准.使用库函数编 ...
Lora、zigbee比较
一 lora 主要频段:470MHz,亚洲其他地区主要是902-928MHz,欧洲主要是868MHz,美洲主要是915mHz lora优点: 通讯距离远(适合半径500m~2km,通信距离大于7000 ...

随机推荐

Node.js+Protractor+vscode搭建测试环境（1）
1.protractor简介官网地址:http://www.protractortest.org/ Protractor是一个end-to-end的测试框架,从网络上得到的答案是Protractor ...
CSS设置input默认样式
HTML <ul class="box"> <li> <input type="checkbox" name="vehi ...
CentOS平滑更新nginx版本
目前使用的nginx版本是1.4.4,平滑升级到nginx1.10.1,具体升级操作流程如下: 1.备份当前使用的nginx程序目录 tar -zcvf ./nginx1.4.4bak.tar.gz ...
jdk8时间格式处理
SimpleDateFormat 是线程不安全的类,一般不要定义为 static 变量,如果定义为 static,必须加锁,或者使用 DateUtils 工具类. 正例:注意线程安全,使用 DateU ...
HTML <area> 对象
<area>对象的属性属性描述 W3C alt 设置或返回当浏览器无法显示某个区域时的替换文字. Yes coords 设置或返回图像映射中可点击区域的坐标. Yes hash 设置或 ...
继续聊WPF——进度条
ProgressBar控件与传统WinForm使用方法完全一样,我们只需关注: Minimum——最小值,默认为0: Maximum——最大值,默认为100. Value——当前值. 关键是它的控 ...
提高生产力:开源Java工具包Jodd(Java的”瑞士军刀”)
官方网站:http://jodd.org/ 下载地址:http://jodd.org/download/index.html Jodd=tools + ioc + mvc + db + aop + t ...
eclipse中使用maven搭建ssh项目思路复习(含有pom.xml)
首先在web.xml中配置监听器在服务器启动的时候进行bean对象的创建(只会创建单例对象 dao service 多例对象action可不会创建每个多例对象是不同的创建了有什么意义呢 ...
Balanced Number
Balanced Number Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 65535/65535 K (Java/Others) ...
百度之星2014初赛 - 1002 - Grids
先上题目: Grids Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 65535/65535 K (Java/Others)Tota ...

避免关注底层硬件，Nvidia将机器学习与GPU绑定

避免关注底层硬件，Nvidia将机器学习与GPU绑定的更多相关文章

随机推荐

热门专题