IBM研究人员开发了一对低功耗,高性能的计算机视觉系统
机器学习算法近年来有了突飞猛进的发展。例如,像Facebook这样的最先进的系统,可以在一小时内训练图像分类算法,而不会牺牲准确性。但是,许多这些系统都是在具有强大GPU的高端机器上进行培训的,随着物联网产业向边缘计算发展,对低功耗低成本人工智能(AI)模型的需求不断增长。

IBM的有前景的研究奠定了更高效算法的基础。在本周召开的2018年计算机视觉和模式识别会议上,来自该公司研究的科学家将发表两篇关于图像分类的论文。
BlockDrop
第一个标题为“BlockDrop:残留网络中的动态干扰路径”,建立在2015年发布的微软工作外:剩余网络。残留网络(简称ResNets)引入神经网络中各层之间的身份连接,使他们能够在训练过程中学习增量或残差表示。
IBM将这一想法向前推进了一步。科学家们引入了一个轻型次级神经网络,在论文中称为“策略网络”,在预训练ResNet中动态地丢弃残余块。为了确保性能收益不以精确为代价,策略网络接受了使用最少数量的块并保持识别准确性的培训。

IBM的研究经理在接受电话采访时表示:”一般来说,如果向模型添加更多图层,您可以提高其准确性,但是会增加计算成本”。今天大多数模型的一个问题是你有一个适用于所有图像相同的计算适用所有网络。我们的系统更有效地分配资源并准确地识别图像。
BlockDrop将图像分类的平均速度提高了20%,在某些情况下高达36%,同时保持76.4%的准确性,与实验的控制相同。
改善立体视觉
IBM研究人员本周发表的第二篇论文“低功耗,高吞吐量,基于事件的立体声系统”解决了图像处理中的另一个问题:立体视觉问题。
正如IBM的研究人员所解释的那样,人类的眼睛彼此相距几厘米,从略微不同的角度看世界。大脑的视觉皮层将它们的图像无缝融合为一体,使我们能够感知深度,但是双摄像机器人系统在调节视差方面有更艰难的时间。在计算机视觉的情况下,相机镜头有异常,这会导致噪音并使问题复杂化。

研究人员的解决方案:运行在IBMTrueNorth神经形态芯片上的系统,该系统具有针对机器学习模型进行了优化的高度并行化架构。使用九个处理器的集群,一对基于事件的摄像头(当它们检测到运动时只拍摄图像的摄像头)以及一台将计算分配给上述芯片的笔记本电脑,算法捕获并处理400(最多达2,000)每秒差异图。
基于事件的摄像机的使用大大减少了带宽和能源消耗。“立体声算法已经存在了30多年,但大多数这些系统......都采用积极的方法来感知世界。我们使用被动方法。“
总体而言,与具有高帧速率照相机的最先进系统相比,该系统在每个视差图的每像素功率方面表现出200倍的提高。(黑客周刊)
IBM研究人员开发了一对低功耗,高性能的计算机视觉系统的更多相关文章
- [转]BSD系统正在死亡?一些安全研究人员这样认为
摘要:在代码安全上被关注太少,漏洞没有被报告修补,FreeBSD.OpenBSD和NetBSD还能活下来吗? 在德国莱比齐的34c3网站上,IOActive的渗透测试主管Ilja von Sprund ...
- 科学效法自然:微软研究人员测试AI控制的滑翔机
编者按:正如一颗苹果砸出了万有引力,自然界所有存在的事物和现象都有其科学合理的一面,小小的鸟儿也能够给科学带来丰富的灵感和启示. 最近,微软研究人员从自然出发,研究鸟类能够自由停留在空中的科学原理,并 ...
- Cortana携手微软学术搜索,变身研究人员最佳个人助理
编者按:在美国时间7月14日于微软总部雷蒙德召开的2014年微软教育峰会上,负责技术与研究的微软全球执行副总裁沈向洋博士在他的开幕主题演讲中正式宣布,Windows Phone 8.1系统中的虚拟个人 ...
- 【GS基础】植物基因组选择研究人员及数量遗传学发展一览
目录 1.GS研究 2.数量遗传发展 GS应用主要在国外大型动物和种企,国内仍以学术为主.近期整理相关学术文献,了解到一些相关研究人员,记录下备忘查询,但不可能全面. 1.GS研究 Theo Meuw ...
- Google研究人员宣布完成全球首例SHA-1哈希碰撞!
2004年的国际密码讨论年会(CRYPTO)尾声,我国密码学家王小云及其研究同事展示了MD5.SHA-0及其他相关杂凑函数的杂凑碰撞并给出了实例.时隔13年之后,来自Google的研究人员宣布完成第一 ...
- 现有各种SSTC电路图,欢迎补充,研究,开发
现有各种SSTC电路图,欢迎补充,研究,开发 496464505 2016-3-1 16:01:55 现在的各种SSTC基本都是这些图 2016-3-3 19:28:23 comter2001 ...
- 研究人员发现绝大部分酷派(Coolpad)手机暗藏后门(转)
隐私问题被曝光得越来越多,随着物联网的发展,只会变得越来越严重,不过从当前看来 ,国人对隐私的重视度还远没有国外,期待加强对隐私的保护策略. 转自:http://www.freebuf.com/n ...
- NGUI研究之开发项目的一些使用心得比較细节
不知不觉使用NGI插件已经有一段时间了.感觉NGUI真的是眼下Unity3D中最好用的UI插件. 可是它也有一些不是BUG的BUG,这些问题可能会让新人摸不着头脑,那么这篇文章将总结一下这段时间 ...
- Linux + .net core 开发升讯威在线客服系统:首个经过实际验证的高性能版本
业余时间用 .net core 写了一个在线客服系统.并在博客园写了一个系列的文章,写介绍这个开发过程: .net core 和 WPF 开发升讯威在线客服系统:目录 https://blog.she ...
随机推荐
- vue中的render函数介绍
简介:对于不了解slot的用法(参考:大白话vue-slot的用法)又刚接触render函数的同学来说,官网的解释无疑一脸懵逼,这里就整理下个人对render函数的理解 问题: 1.render函数是 ...
- stack1顺序栈
顺序栈 #include<iostream> using namespace std; #define increasesize 10 template <class Object& ...
- bootstrap 前端框架学习笔记
下面是一个基于 bootstrap 前端架构的最最基本的模板: (这里添加慕课网的学习笔记.) 1.认识一下 bootstrap 带来的优雅效果: 代码: <!DOCTYPE html> ...
- 导入maven项目pom.xml首行报错missing artifact。。。
解决方法: 在maven地址(如一般默认的地址C:\Users\Administrator\.m2\repository\)找到对应包名 加后缀名为.lastUpdated文件(如:ojdbc14.l ...
- gcc -o hello hello.c 执行过程
GCC编译器驱动程序读取源程序文件hello.c,并将它翻译成一个可执行目标文件hello.这个翻译的过程可分为四个阶段. 1.预处理阶段 预处理器(cpp)根据以字符#开头的命令,修改原始的c程序. ...
- 电脑可以识别sd卡手机无法识别 的解决方法。 我成功了。 淘宝买的sd卡 不用退货了。 退的人肝疼
https://wenku.baidu.com/view/822e471055270722192ef736.html 电脑可以识别 sd 卡手机无法识别 * (本教程只是本人实际操作方法,可以解决一部 ...
- poj3126Prime Path (BFS+素数筛)
素数筛:需要一个数组进行标记 最小的素数2,所有是2的倍数的数都是合数,对合数进行标记,然后找大于2的第一个非标记的数(肯定是素数),将其倍数进行标记,如此反复,若是找n以内的所有素数,只需要对[2, ...
- Optimal Subsequences(主席树)
题意: 给定一个序列,长度为n(<=2e5),有m(<=2e5)个询问,每个询问包含k和pos,要从原序列中选出一个长度为k的子序列,要求是这个序列的和是所有长度为k的序列中最大的,且是字 ...
- Java thread(3)
线程间的调度策略 通常是选择优先级高的线程,但是若发生以下情况则终止线程的运行: 1 调用yield 让出对cpu的占用权. 2 调用sleep 3 线程由于I/O操作而受阻 4 更高优先级的线 ...
- 获取EasyUI日期输入框的值
var date = $('#PurDate').datebox('getValue');