机器学习算法近年来有了突飞猛进的发展。例如,像Facebook这样的最先进的系统,可以在一小时内训练图像分类算法,而不会牺牲准确性。但是,许多这些系统都是在具有强大GPU的高端机器上进行培训的,随着物联网产业向边缘计算发展,对低功耗低成本人工智能(AI)模型的需求不断增长。

  IBM的有前景的研究奠定了更高效算法的基础。在本周召开的2018年计算机视觉和模式识别会议上,来自该公司研究的科学家将发表两篇关于图像分类的论文。

  BlockDrop

  第一个标题为“BlockDrop:残留网络中的动态干扰路径”,建立在2015年发布的微软工作外:剩余网络。残留网络(简称ResNets)引入神经网络中各层之间的身份连接,使他们能够在训练过程中学习增量或残差表示。

  IBM将这一想法向前推进了一步。科学家们引入了一个轻型次级神经网络,在论文中称为“策略网络”,在预训练ResNet中动态地丢弃残余块。为了确保性能收益不以精确为代价,策略网络接受了使用最少数量的块并保持识别准确性的培训。

  IBM的研究经理在接受电话采访时表示:”一般来说,如果向模型添加更多图层,您可以提高其准确性,但是会增加计算成本”。今天大多数模型的一个问题是你有一个适用于所有图像相同的计算适用所有网络。我们的系统更有效地分配资源并准确地识别图像。

  BlockDrop将图像分类的平均速度提高了20%,在某些情况下高达36%,同时保持76.4%的准确性,与实验的控制相同。

  改善立体视觉

  IBM研究人员本周发表的第二篇论文“低功耗,高吞吐量,基于事件的立体声系统”解决了图像处理中的另一个问题:立体视觉问题。

  正如IBM的研究人员所解释的那样,人类的眼睛彼此相距几厘米,从略微不同的角度看世界。大脑的视觉皮层将它们的图像无缝融合为一体,使我们能够感知深度,但是双摄像机器人系统在调节视差方面有更艰难的时间。在计算机视觉的情况下,相机镜头有异常,这会导致噪音并使问题复杂化。

​  研究人员的解决方案:运行在IBMTrueNorth神经形态芯片上的系统,该系统具有针对机器学习模型进行了优化的高度并行化架构。使用九个处理器的集群,一对基于事件的摄像头(当它们检测到运动时只拍摄图像的摄像头)以及一台将计算分配给上述芯片的笔记本电脑,算法捕获并处理400(最多达2,000)每秒差异图。

  基于事件的摄像机的使用大大减少了带宽和能源消耗。“立体声算法已经存在了30多年,但大多数这些系统......都采用积极的方法来感知世界。我们使用被动方法。“

  总体而言,与具有高帧速率照相机的最先进系统相比,该系统在每个视差图的每像素功率方面表现出200倍的提高。(黑客周刊)

IBM研究人员开发了一对低功耗,高性能的计算机视觉系统的更多相关文章

  1. [转]BSD系统正在死亡?一些安全研究人员这样认为

    摘要:在代码安全上被关注太少,漏洞没有被报告修补,FreeBSD.OpenBSD和NetBSD还能活下来吗? 在德国莱比齐的34c3网站上,IOActive的渗透测试主管Ilja von Sprund ...

  2. 科学效法自然:微软研究人员测试AI控制的滑翔机

    编者按:正如一颗苹果砸出了万有引力,自然界所有存在的事物和现象都有其科学合理的一面,小小的鸟儿也能够给科学带来丰富的灵感和启示. 最近,微软研究人员从自然出发,研究鸟类能够自由停留在空中的科学原理,并 ...

  3. Cortana携手微软学术搜索,变身研究人员最佳个人助理

    编者按:在美国时间7月14日于微软总部雷蒙德召开的2014年微软教育峰会上,负责技术与研究的微软全球执行副总裁沈向洋博士在他的开幕主题演讲中正式宣布,Windows Phone 8.1系统中的虚拟个人 ...

  4. 【GS基础】植物基因组选择研究人员及数量遗传学发展一览

    目录 1.GS研究 2.数量遗传发展 GS应用主要在国外大型动物和种企,国内仍以学术为主.近期整理相关学术文献,了解到一些相关研究人员,记录下备忘查询,但不可能全面. 1.GS研究 Theo Meuw ...

  5. Google研究人员宣布完成全球首例SHA-1哈希碰撞!

    2004年的国际密码讨论年会(CRYPTO)尾声,我国密码学家王小云及其研究同事展示了MD5.SHA-0及其他相关杂凑函数的杂凑碰撞并给出了实例.时隔13年之后,来自Google的研究人员宣布完成第一 ...

  6. 现有各种SSTC电路图,欢迎补充,研究,开发

    现有各种SSTC电路图,欢迎补充,研究,开发  496464505 2016-3-1 16:01:55 现在的各种SSTC基本都是这些图   2016-3-3 19:28:23 comter2001 ...

  7. 研究人员发现绝大部分酷派(Coolpad)手机暗藏后门(转)

    隐私问题被曝光得越来越多,随着物联网的发展,只会变得越来越严重,不过从当前看来 ,国人对隐私的重视度还远没有国外,期待加强对隐私的保护策略.   转自:http://www.freebuf.com/n ...

  8. NGUI研究之开发项目的一些使用心得比較细节

     不知不觉使用NGI插件已经有一段时间了.感觉NGUI真的是眼下Unity3D中最好用的UI插件. 可是它也有一些不是BUG的BUG,这些问题可能会让新人摸不着头脑,那么这篇文章将总结一下这段时间 ...

  9. Linux + .net core 开发升讯威在线客服系统:首个经过实际验证的高性能版本

    业余时间用 .net core 写了一个在线客服系统.并在博客园写了一个系列的文章,写介绍这个开发过程: .net core 和 WPF 开发升讯威在线客服系统:目录 https://blog.she ...

随机推荐

  1. 对拍 & 随机数生成

    用 Windows 批处理对拍: 1. 新建一个批处理(.bat),代码如下: :loop@echo off data_creator.exe force_solution.exe correct_s ...

  2. [CSP-S模拟测试]:Tree(贪心)

    题目描述 给定一颗$n$个点的树,树边带权,试求一个排列$P$,使下式的值最大 $$\sum \limits_{i=1}^{n-1}maxflow(P_i,P_{i+1})$$ 其中$maxflow( ...

  3. php面试专题---MySQL分表

    php面试专题---MySQL分表 一.总结 一句话总结: 分库分表要数据达到一定的量级才用,这样才有效率,不然利不一定大于弊,可能会增加一次I/O消耗 1.分库分表的使用量级是多少? 单表行数超过 ...

  4. php面试专题---15、MySQL数据库基础考察点

    php面试专题---15.MySQL数据库基础考察点 一.总结 一句话总结: 注意:只写精品 1.mysql定义int(3),那么我存1234就错了么? 不是:无影响:只会影响显示字符的个数:可以为整 ...

  5. EZOJ #393加倍的飞机

    分析 从大到小考虑每个点 记录一个连通块中选了选了几个 如果选的小于siz则直接选否则不选 代码 #include<bits/stdc++.h> using namespace std; ...

  6. CentOS修改网络设置,不容易啊,终于可以在virtualbox里上网了

    CentOS 修改网关 修改对应网卡的网关的配置文件[root@centos]# vi /etc/sysconfig/network修改以下内容NETWORKING=yes(表示系统是否使用网络,一般 ...

  7. Mac版-python环境配置(一):Python下载安装

    Mac OS X系统自带python,可以在终端输入python查看版本[输入exit()即可退出],如下: 从上图中可以看到,mac自带python 2.7.10,版本相对较低.现在python已升 ...

  8. Activation Functions and Their Derivatives

    1. Sigmoid Function: when z=0,g'(z)=0.25 2. tanh Function: when x=0,tanh'(x)=1 3. Relu

  9. 应用安全-XXE(XML外部实体注入)攻防整理

    libxml2..1及以后,默认不解析外部实体.测试的时候window下使用php5.(libxml Version ), php5.(libxml Version ).Linux中需要将libxml ...

  10. Java基础复习(1)

    1. Java 基本数据类型 参考博客: https://www.cnblogs.com/LiaHon/p/11043238.html Java语言提供了八种基本类型. 六种数字类型(四个整数型,两个 ...