在先进驾驶辅助系统(ADAS)中,结合视觉处理器的CMOS影像感测器已在协助汽车辨识与分类方面发挥关键作用。至于其“听觉”呢?

麦克风也能扮演像摄影机般重要的角色,为自动驾驶车增添更多“智慧”功能吗?

DSP Concepts执行长与创办人Paul Beckmann表示,在汽车和驾驶人发现救护车接近以前,就已经听到它的警报声响起了。那么为什么汽车产业不会对音讯感兴趣?

系统OEM厂商(不只是汽车制造商)目前正处于“使用更多麦克风以便为人工智慧(AI)产生另一种重要感测器资料——音讯”的关键时刻,Beckmann解释。

正如他所预设的,音讯正“从单纯的在娱乐系统中播放,朝向在情境架构中实现输入、触发与分析。”

由麦克风所拾取的智慧,也可能用于日常生活的各种系统中,从汽车、数位虚拟助理到可携式装置等。“视觉与听觉应该并驾齐驱,”DSP Concepts业务与行销执行总裁Willard Tu表示。“狗吠声、婴儿哭闹、玻璃碎裂、汽车喇叭、警报声与枪声等等......音讯有助于让系统更有效地掌握环境[和情境]。”

图1:音讯“输入”演算法发展蓝图

如今,有两个重要的发展趋势推动电子产业突然在音讯领域迅速发展。

一是拥有多颗麦克风的智慧型手机普及;其次则是数位虚拟助理的流行,如Amazon Echo与Google Home。根据SAR Insight & Consulting总监与首席分析师Peter Cooney的观察,“一般消费装置中整合虚拟数位助理的应用越来越多,带动感知与采用语音作为自然的使用者介面,应用于许多日常任务中。”

但是,麦克风能多快超越作为一种自然使用者介面的角色,开始变成真正的‘智慧感测器’?看来业界还得等待一些进展。

为了迎接挑战,音讯需要可以拾取更佳音质的麦克风、善于后处于音讯的处理器、预处理音讯的有效演算法、易于使用的音讯处理工具、相当于绘图用Open GL的音讯标准,以及能以最小功耗维持永不断线的麦克风。

总之,如同Cooney所指出的,市场需要“始终保持监听的技术、语音增强演算法以及麦克风。”

在ARM处理器上实现音讯处理

音讯处理以往是播放系统(如TV、DVD和Hi-Fi音响系统中的等化器)才需要的专业领域。

而今在智慧型手机和其他家用装置的麦克风普及带动下,音讯处理任务已经扩展到几乎无处不在。专用音讯DSP也并不是系统中处理音讯的唯一晶片了。

随着越来越多的音讯开始在ARM处理器上执行,Beckmann指出,更多的OEM“热切地将麦克风视为”AI的输入感测器。DSP Concepts正处于观察这一市场过渡的最佳位置。

Beckmann看好市场成长的态势,特别是因为该公司一款称为Audio Weaver在过去一年来的成果。如同Beckmann描述的,这是“唯一一款可跨平台作业的绘图音讯设计架构。”

业界分析家认为,DSP Concepts正占据音讯市场上的独特位置。TECHnalysis Research总裁兼首席分析师Bob O'Donnell认为:“我并未看到DSP Concepts或其Audio Weave工具面对哪几家竞争对手。许多公司都针对音乐与录音等目的进行专业的音讯剪辑与音讯处理,但这毕竟是不同的领域。”

库尼表示同意。“我不知道任何竞争产品音频织女的。”他补充说,“DSP概念有其他的产品也是如此,如声音增强算法(噪音抑制,回声取消,波束赋形),基准和参考设计。”

Cooney也同意这一看法。“我还不知道Audio Weaver有任何竞对手。”他补充说,“DSP Concepts也有其他的产品,例如声音增强演算法(杂讯抑制、回音消除、波木成形等)、基准与参考设计。”

图2:全球麦克风与音讯处理器市场

DSP Concepts并未设计或销售DSP。然而,竞争对手一般都是其他的DSP业者。Audio Weaver的竞争产品来自德州仪器(TI)或Cirrus Logic等DSP供应商自行打造的音讯工具。其差异之处在于那些内部开发的工具仅用于DSP供应商自家的晶片。而采用像Audio Weaver这样的独立平台工具,Tu强调,“OEM不必被限制于一种特定的DSP。”

Cooney说,DSP Concepts藉由与Cadence/Tensilica等许多公司合作,主要的业务在于为其客户提供音讯设计解决方案。

除了Audio Weaver工具,DSP Concepts也授权一些可形成麦克风输入的音讯演算法,包括波束成形、回声消除、杂讯消除与远音场(far-field sound)等演算法。Beckmann指出,在此业界缺乏深谙音讯处理的工程人才之际,市场亟需易于使用的音讯预处理演算法,以便能从不需要的环境杂讯中区隔出声音来。

音讯:长期受冷落的领域

然而,目前使用音讯进行声学事件检测(和分析)仍然是一种相对较新的应用。

O’Donnell指出,“理论上,可能会有更多专用音讯处理器在做AI,但坦白说,音讯就像是长期受到视讯的冷落一样,而且时至今日也是如此。”

他补充说,声音的另一项重大挑战是“语言与意义”。他说,“一张树的图片以任何语言来说是树,但要瞭解字、词以及最重要的意义与意图,就具有语言与文化的独特性了。这使得语音辨识与自然语言的处理变得十分困难。”

Beckmann坦承,音讯缺乏标准,也造成了差距。

以OpenGL来看,它是一种针对图形渲染的跨语言、跨平台API。对于想要编写程式码的视讯游戏设计人员来说,这种API十分重要。像Nvidia等GPU供应商在使用这种API后就能最佳化其硬体。

音讯世界则可以使用硬体抽象层来实现跨平台的硬体加速渲染,类似于OpenGL所扮演的角色一样。如果缺乏标准,每一家音讯晶片公司都必须最佳化自家硬体以及自给自足。缺乏标准延缓了扩展跨平台的音讯应用所需的创新脚步。

实现永不断电的续航力

Amazon Echo或Google Home等流行的数位虚拟助理下一步要实现的就是“长时倾听”(always-listening)的能力。Amazon正透过其‘tap-then-speak’的语音启动机制加速这方面的进展。但该装置还不能称得上是‘always listening’。

图3:全球语音介面与长时倾听技术市场

具有永不断线/长时倾听能力的装置一旦走出家门,将开始面临各种挑战。到了户外,它的音讯处理能力必须从背景杂讯中区隔出需要听到的声音。此外,Beckmann强调,更大的问题还在于电池寿命。

为此,他指出,“位于波士顿的新创公司Vesper开发的静态感测MEMS元件就十分关键。”Vesper专门开发压电MEMS麦克风,不久前还发布了一款新的声学感测器,可利用声能唤醒完全待机中的系统。

Vesper执行长Matt Crowley表示,这款新的压电MEMS麦克风VM1010可在倾听模式下汲取仅3μA电流,该元件预计在今年第四季出样。Crowley并承诺,VM1010的新版本将会配备“鉴频”(frequency discrimination)功能。这表示系统设计者可因应枪声、玻璃粉碎或人声等特定的杂讯特性编程MEMS麦克风。

汽车内部

回过头来看看汽车内部的音讯应用。语音为汽车内部提供了自然的人机介面(HMI)。

为了提高驾驶人使用免持听筒的语音品质,一线业者与汽车OEM严重地依赖音讯处理技术。Beckmann说,“配备多声道(从8-32声道)扬声器的汽车,带来了十分复杂的音讯系统。”

不仅如此,随着电动车的出现,汽车产业开始使用假引擎噪音——或“电子声音”。从BMW到福斯(Volkswagen)等越来越多的汽车制造商开始玩各种共鸣放大器技巧。事实上,不只是电动车,当今更省油的引擎声音更安静,也较不那么有力了。汽车制造商担心所有的平静可能会让潜在买家却步。

对于汽车产业的许多人来说,音讯是熟悉的领域。汽车制造商们知道,音讯可以为其提供差异化。车内的声学感测器不仅可以听到外面发生的事情,未来,车子自己的引擎也能够针对诊断应用侦测任

汽车变智能只靠ADAS?麦克风也是主角的更多相关文章

  1. 一个软件工程师的硬件修养:ESP8266 入门(普通动感单车-变智能)

    前言 一直在开发软件.今日突然心血来潮想尝试一下硬件. 于是就买了这样一个板子: 买的淘宝上大佬帮忙找的一个套装. 除了板子之外还有一些线和其他配件:温湿度传感器,气压传感器,光线传感器,小屏幕. 板 ...

  2. Creazy Ideas 智能汽车和智能交通

    1.现在无人驾驶靠的是摄像头监测障碍物,计算可行路线(这个结论是看到相关视频中百度无人驾驶测试中大大的摄像头推测的,非确切信息).而非像人一样对客观事物的认知学习得到障碍物的信息,如果能将AI融入进去 ...

  3. ADAS处理器集成功能安全单片机MCU

    ADAS处理器集成功能安全单片机MCU ADAS processors integrate functional safety MCU 拉斯维加斯-德州仪器公司引进了ADAS和网关处理器TDA4VM和 ...

  4. 智能硬件+App移动新生态【11.01深圳】

    活动概况 时间:2015年11月01日13:30-16:30 地点:深圳腾讯大厦(南山区科技园科技中一路)2楼多功能厅 主办:APICloud.庆科.信鸽 费用:免费 活动背景 智能电视.智能汽车.智 ...

  5. 智能硬件+App移动新生态【10.24北京站】

    活动概况 时间:2015年10月24日13:30-16:30 地点:Wepac空间(海淀区北四环西路68号左岸工社6层) 主办:APICloud.机智云.智石科技.华为云 网址:www.apiclou ...

  6. c#4.0新特性之协变与逆变

    1.C#3.0以前的协变与逆变 如果你是第一次听说这个两个词,别担心,他们其实很常见.C#4.0中的协变与逆变[1](Covariance and contravariance)有了进一步的完善,主要 ...

  7. .NET 4.0中的泛型逆变和协变

    转载自:http://www.cnblogs.com/Ninputer/archive/2008/11/22/generic_covariant.html:自己加了一些理解 随Visual Studi ...

  8. 详解C#的协变和逆变

    一.使用协变(Covariance)和逆变(Contravariance )能够实现数组之间.委托实例和方法之间.泛型委托实例之间.泛型接口的变量和泛型类型的对象之间.泛型接口的变量之间的隐式转换:使 ...

  9. Python爬虫——使用 lxml 解析器爬取汽车之家二手车信息

    本次爬虫的目标是汽车之家的二手车销售信息,范围是全国,不过很可惜,汽车之家只显示100页信息,每页48条,也就是说最多只能够爬取4800条信息. 由于这次爬虫的主要目的是使用lxml解析器,所以在信息 ...

随机推荐

  1. flex常用快捷键

    先插入一条广告,博主新开了一家淘宝店,经营自己纯手工做的发饰,新店开业,只为信誉!需要的亲们可以光顾一下!谢谢大家的支持!店名: 小鱼尼莫手工饰品店经营: 发饰.头花.发夹.耳环等(手工制作)网店: ...

  2. OpenCV Create Circular Mask 圆形遮罩

    在OpenCV中,比较常见的是矩形遮罩CvRect,没有专门提供圆形的mask,那么我们只能自己写一个来模拟圆形mask的函数,需要提供的参数为原图的大小,以及圆形mask的圆心位置和半径即可,返回一 ...

  3. Ubuntu16.04 安装lamp环境

    拿到新装的ubuntu16.04新系统 首先 apt-get update 更新一下 我这里是root用户,如果您不是超级管理员,命令前加sudo即可 如果您加了sudo也不好使,那就联系管理员,给你 ...

  4. js生成二维码以及点击下载二维码

    js生成二维码 jquery.qrcode.js可以快速使用页面生成二维码.但改项目有两个小问题:1.不支持中文:2.不支持二维码中间生成图片. 支持中文的jquery-qrcode jquery.q ...

  5. hdu6390GuGuFishtion【数论】

    GuGuFishtion Time Limit: 3000/1500 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others) Tot ...

  6. hdu1540 Tunnel Warfare【线段树】

    During the War of Resistance Against Japan, tunnel warfare was carried out extensively in the vast a ...

  7. 《机器学习实践》程序清单3-7 plotTree函数

    这个plotTree函数,比较聪明,比较简化,比较抽象,作者一定是逐步优化和简化到这个程度的.我是花了小两天时间,断断续续看明白的,还是在参考了另一篇文章以后.这里是链接http://www.cnbl ...

  8. codeforces 883H - Palindromic Cut - [字符串处理]

    题目链接:http://codeforces.com/problemset/problem/883/H Time limit: 3000 ms Memory limit: 262144 kB Koly ...

  9. the internal array pointer

    The foreach construct provides an easy way to iterate over arrays. foreach works only on arrays and ...

  10. Percona Data Recovery Tool 单表恢复

    前几天写过update或者delete忘加where条件的数据恢复.今天介绍一款开源的MySQL数据库InnoDB数据恢复工具:innodb-tools,它通过从原始数据文件中提取表的行记录,实现从丢 ...