自己动手做AI:Google AIY开发工具包解析

2018年国际消费性电子展(CES)上,最明显的一个趋势是Amazon与Google的语音技术进驻战,如AmazonAlexa进驻到Acer笔电内,Google Assist进驻到KIA汽车内,其他如智能电视、智能喇叭,乃至传统数字录放机TiVo都成为抢占进驻的对象。

Google Assistant
语音识别进驻大战
这是一波新的抢滩战,过去Google具有PC上网的搜寻入口优势,使Google赚取庞大的广告中介收益。但上网的形式在改变,包含走动时对手机「说」、客厅躺卧时对智慧喇叭「说」、或开车时对行车计算机「说」,都要得到搜寻响应,而且是语音响应,这就成了语音识别进驻大战的开端,而且比过去的搜索引擎更激烈。搜索引擎一次还可以显现三、五个结果选项,但语音响应只能逐一念,听完前三个大概就没耐性了,所以第一个响应的答案,将更为重要。
为了让自家的语音识别、认知运算、人工智能等技术更普及,Amazon与Google也推出相关套件,并尽可能平价供应给有兴趣体验的开发人员,例如2016年6月Amazon即以树莓派计算机(RPi 2 Model B)为基础搭配其Alexa软件,就可模块出Amazon Echo的效果,并进行相关开发(详细信息可参考这里)。
https://aws.amazon.com/cn/blogs/china/raspberry-alexa/
Google智能语音,强势出击

Voice Kit
去年,Google也推出开发类似的套件,称为AIY,取自人工智能的AI(Artificial Intelligence),与自己动手做的DIY(Do ItYourself)两字合并而成,意指自己动手做的人工智能套件。Google率先推出语音版本的套件,即Google AIY Voice Kit,而后也推出视觉版本的套件Google AIY Vision Kit。
Google AIY或许受到Amazon的启发,所以也是以树莓派计算机为基础,再搭上必要的硬件外围与零件,构成最基本需求的语音、视觉辨识开发装置,同时也可能受到IBM发起的TJBot项目(同样是以树莓派为基础的语音识别、人工智能应用装置)所影响,追加了纸板外壳与简单的互动接口,例如会三色发光的LED灯号与按钮,但并没有TJBot的摆动手臂(用伺服马达驱动)。
Google推出第一套语音版时(称为V1),所搭配使用的树莓派计算机仍是一般最普及常见的Model B(树莓派3),价格比较高,约35美元。但之后再推出的语音版及视觉版则改采了较便宜的Pi Zero W(无线版的Pi Zero),价格约10美元。
无论视觉版或语音版套件都包含了树莓派在里头,也包含了树莓派所需要的MicroSD记忆卡,另外若是视觉版还额外包含了树莓派用的摄影机模块(V2版),如此语音版套件的价格约49.99美元,视觉版则为89.99美元。
视觉版 VS 语音版
既然视觉版与语音版有价差,那么差在何处?事实上视觉版与语音版有一些相同的配件,如三色LED灯号、按钮、GPIO接脚线路等,两版本的主要差异在于:视觉版的介接板卡(称为VisionBonnet board,语音版则称为VoiceBonnet board)上多一颗图像处理人工智能芯片,也称为VPU(Vision Processing Unit视觉处理单元),即Intel Movidius MA2450,Movidius是Intel于2016年购并的业者。

视觉版
MA2450可以强化视觉运算,减轻树莓派计算机的视觉运算负荷,同时还能执行神经网络的运算工作,此是视觉版要多贵出40美元的主因。当然!视觉版还有提供摄影机与摄影机上盖护镜,但同时没有语音版的喇叭,取而代之的只有简单的蜂鸣器。

语音版
由于语音运算明显比视觉轻量,纯耗用树莓派计算机的运算力即可,不需要额外的加速运算芯片,因而成本与订价可以低于视觉版。
Vision Kit的辨识模型简介
值得注意的是,视觉版有附带三套以TensorFlow为基础的神经网络模型软件:第一套是盘中物辨识,是采开放源代码的神经网络模型项目MobileNets所建构成,可辨识上千个常见的生活用品;第二套可辨识出影像中的人脸,并透过脸部表情分析目前的心情愉悦度,打出愉悦分数;第三套则可辨识影像中何者为人、何者为猫、何者为狗。
此外官网还有列出其他的辨识模型,例如:辨识碗盘内放的东西为何物?辨识自然界的景物等,多数模型也是基于MobileNets所构成,但也有基于SqueezeNet所构成的模型。
视觉版中也附有编译工具软件,可以在工作站或云端上,对模型进行训练、再训练等编译。至于语音版,所附的软件主要是Google Assist的软件开发工具包(SDK)与示范用应用程序(DEMO Application)。
其他配套也包含Google Play应用程序商店的卖架上可以找到Google AIY Projects的手机应用程序(App),可免费下载安装使用,并搭配AIY硬件套件一起开发运用。
结束语
Google在最后也出一些发想题,好激发大家的人工智能开发撰写动力,例如用视觉版套件开发出能辨识各种动植物的人工智能软件,辨识正在行驶的车子是否有偏离车道?辨识您的访客是否满意您家里的节庆装饰等,这些都期望能以视觉版套件的软硬件为基础,更快完成与实现。
原文参考
https://mp.weixin.qq.com/s?__biz=MzU0MTg0ODIzNA==&mid=2247484725&idx=1&sn=6d53e71d6a7f0b4b8aca0d2ab253cf6a&chksm=fb22e2f0cc556be61a07a93a7ce2221d4a866eaeb6ad124c06f7f5dd6051a138c77ab692d524#rd

自己动手做AI:Google AIY开发工具包解析的更多相关文章
- 动手做webserver的核心之http解析
简介 webserver往小里说核心功能就是socket管理.url处理.http协议处理.业务dll管理等:下面简介绍一下http协议:超文本传输协议(HTTP)是一种通信协议,当时就是为web传输 ...
- 线程安全使用(四) [.NET] 简单接入微信公众号开发:实现自动回复 [C#]C#中字符串的操作 自行实现比dotcore/dotnet更方便更高性能的对象二进制序列化 自已动手做高性能消息队列 自行实现高性能MVC WebAPI 面试题随笔 字符串反转
线程安全使用(四) 这是时隔多年第四篇,主要是因为身在东软受内网限制,好多文章就只好发到东软内部网站,懒的发到外面,现在一点点把在东软写的文章给转移出来. 这里主要讲解下CancellationT ...
- 【雕爷学编程】MicroPython动手做(01)——春节后入手了K210开发板
Python的开放.简洁.黏合正符合了现发展阶段对人工智能.大数据分析.可视化.各种平台程序协作产生了快速的促进作用.自Python3的发布到现在已有五六年的时间,从刚发布的反对声音到慢慢被接受与喜欢 ...
- 【雕爷学编程】MicroPython动手做(02)——尝试搭建K210开发板的IDE环境
喜欢今日头条,偶然看到广告,半个多月前交了8.9元,报名参加了头条上Python的四天培训课,呵呵,总算是有了零的开始(还是有点收获的,见https://www.sohu.com/a/38112874 ...
- 为什么很多国内公司在做 AI 芯片?
据网上搜到的新闻报道,截止2019年,已经有20家企业投入到 AI 芯片的研发中,其中有很多厂商的芯片已经流片甚至商用了.为何有这么多公司在做AI芯片呢?简单来讲就是四个字:有利可图.具体来说有以下三 ...
- [转]Android通过NDK调用JNI,使用opencv做本地c++代码开发配置方法
原文地址:http://blog.csdn.net/watkinsong/article/details/9849973 有一种方式不需要自己配置所有的Sun JDK, Android SDK以及ND ...
- C#动手实践:Kinect V2 开发(1):初步了解及环境搭建
该分享使用的是Kinect 二代,C#做为编程语言,请知悉 Kinect是微软在2009年6月2日的E3游戏展上,正式公布的XBOX360体感周边外设.它是一种3D体感摄影机,同时它导入了即时动态捕捉 ...
- IP工具类-自己动手做个ip解析器
IP工具类-自己动手做个ip解析器 一.资料准备 导入依赖包:
- python 全栈开发,Day90(Vue组件,前端开发工具包)
昨日内容回顾 1. Vue使用 1. 生成Vue实例和DOM中元素绑定 2. app.$el --> 取出该vue实例绑定的DOM标签 3. app.$data --> 取出该vue实例绑 ...
随机推荐
- Semtech 的 137-1050 MHz 超低功耗长距离收发器(SX1276 Long Range Transceiver)
SX1276 收发器采用 LoRa? 长距离调制解调器,可实现超长距离扩频通信和高抗干扰能力,并将电流消耗降至最低.凭借 Semtech 专利的 LoRa 调制技术,SX1276 使用低成本晶体和物料 ...
- 【luogu P1558 色板游戏】 题解
题目链接:https://www.luogu.org/problemnew/show/P1558 我知道三十棵线段树很暴力,可是我们可以状压啊. 颜色最多30,不会爆int 另外 吐槽评测机 #inc ...
- Loadrunner上传文件与下载文件脚本
Loadrunner上传文件与下载文件脚本 一. 上传脚本 Action() { int uploadImgStatus = 0; //获取上传产品图ID web_reg_save_param_ex( ...
- Objective-C基础知识之“类”
Objective-C语言是iOS开发的专用语言,虽然现在在逐步被swift语言取代,但是仍可以作为基础学习,学会Objective-C之后入手swift也是相当快速.今天我来简谈一下关于OC中的类. ...
- #leetcode刷题之路24-两两交换链表中的节点
给定一个链表,两两交换其中相邻的节点,并返回交换后的链表.你不能只是单纯的改变节点内部的值,而是需要实际的进行节点交换. 示例:给定 1->2->3->4, 你应该返回 2-> ...
- 升级Xcode10报错问题修复
Xcode10 问题1 报文件重复 File--> Workspace Settings --> Build System 修改为Legacy Build System (默认是New B ...
- MongoDB DBA 实践4-----创建复制集
一.复制 复制允许多个数据库服务器共享相同数据的功能,从而确保冗余并促进负载平衡 1.数据冗余及可用性 复制技术提供数据冗余及可用性,在不同的数据库服务器上使用多个数据副本,复制技术防止单个数据库服务 ...
- 【原创】CRM 2015/2016,SSRS 生成PDF文件,幷以附件的形式发送邮件
主要步骤如下: 生成一条邮件记录 生成一条ActivityParty记录 生成PDF文件,并以Base64添加到ActivityMimeAttachment 中去 打开发送邮件窗口,以便编辑及发送邮件 ...
- MAC下绕开百度网盘限速下载的方法,三步操作永久生效
第一步:下载所需工具:(①②步我放在同一个文件夹,可一起下载,链接失效请留言) 工具地址:链接: https://pan.baidu.com/s/1raicYzM 密码: ve3n ①下载Aria2G ...
- 浅析Vue.js 中的条件渲染指令
1 应用于单个元素 Vue.js 中的条件渲染指令可以根据表达式的值,来决定在 DOM 中是渲染还是销毁元素或组件. html: <div id="app"> < ...