语音是HoloLens三大重要输入形式之一。它允许你直接通过语言控制全息图像,而不用借助手势。你只要凝视全息图像然后说出语音命令即可。语音输入是自然的交互方式,它能够很好的改善复杂的交互,因为通过一条语音命令即可以减少很多复杂的UI菜单。

HoloLens语音输入是由同UWP应用一样的语音识别引擎支持。

选中命令 The "select" command


即使没有特地为应用添加语音命令特性,用户还是能够通过说:“select”来简单地激活你的全息图像。这个行为和用手或点击器点击类似。你将会听到一声提示音,同时会看到一条提示:“Select”,用以确认你的语音指令。“Select”命令是由低功耗关键词识别算法来保证的,所以任何时候你都能使用它,这只会带来极低的电量生命周期影响。

激活Cortana Hey Cortana


任何时候你都可以通过说:"Hey Cortana"来激活它,并且不用等待它出现,即可继续问它问题或给出指令。关于Cortana的更多信息和你能做什么,你直接询问它即可。可以说:"Hey Cortana, What Can I Say?",然后它会更出作业和推荐的语音命令列表。如果你已经进入Cortana应用,点击 ? 按钮同样可以获得提示列表。

HoloLens特定语音命令 HoloLens-specific commands

  • Go Home - 唤出开始菜单
  • Launch <应用名> - 打开应用
  • Take a picture
  • Start recording
  • Stop record
  • Increase the brightness
  • Decrease the brightness
  • Increase the volume
  • Decrease the volume
  • Shut down the device
  • Restart the device
  • Reboot the device
  • Go to sleep
  • What time is it?
  • What is my IP address?
  • Am I connected to the network?
  • Are you listening?
  • How much battery do I have left?
  • Call <联系人> - 需要安装HoloSkype
  • Web search

"See It, Say It"模式


对于语音输入,HoloLens有一个"See It, Say It"模式,在此模式内按钮上会出现文本提示来告诉用户应该使用什么语音命令来使用它。例如,我们看向一个2D应用,当我们看到Holobar上的Adjust按钮时,会出现文本提示框,此时我们直接说:"Adjust"命令即可调整应用在世界中的位置。

当应用遵循此规则时,用户可以很容易地明白应该说什么命令来控制系统。为了加强此特性,当用户凝视按钮时,你可以显示一个语音命令提示栏,来使用户明白此按钮支持语音输入同时明白应该说什么指令。

语音转文字 Dictation


和通过点击手势输入一样,语音听写能够更有效地在应用中输入文本。这能更好地加快用户输入,以减少输入对用户体验的影响。

任何时候全息键盘激活后,你都能将输入模式切换到听写模式。可以通过点击文本输入框左边的麦克风按钮来开始听写操作。

通信 Communication


对于那些想要使用HoloLens自定义语音输入处理选项的应用来讲,理解音频流类别(audio stream categories)很重要。Windows 10支持数种音频流类别,同时为了优化为语音输入、通信和其他辅助周边环境音频捕获场景量身定制的麦克风音频质量,HoloLens支持其中3种类别来保证自定义音频处理。

  • AudioCategory_Communications流类别被自定义用于通话质量和叙述场景,提供给客户端用户声音的16kHz 24位单声道音频流.
  • AudioCategory_Speech流类别被定制用于HoloLens(Windows)语音识别引擎,提供它们 16kHz 24位单声道用户音频流。如果需要的话,此流类别亦可用于第三方语音识别引擎。
  • AudioCategory_Other流类别被定制用于周边环境声音录制,提供给客户端 48kHz 24位立体声音频流。

所有的音频处理都通过硬件加速,这意味着此特性会大大降低电池消耗,如果与CPU处理同样音频作业相比的话。通过避免在CPU上处理其他音频输入进程,可以最大化系统电池生命周期,同时能够利用上内置的音频处理作业。

问题诊断 Troubleshooting


如果你在使用"select"和"Hey Cortana"语音命令中遇到任何问题,请尝试移动到安静的空间,远离噪音来源,或者尝试大声说话。此时,HoloLens上所有的语音识别都将特地为美式英语调整和优化。

HoloLens开发手记 - 语音输入 Voice input的更多相关文章

  1. HoloLens开发手记 - 手势输入 Gesture input

    手势是HoloLens三个首要输入形式之一.一旦你使用凝视定位了一个全息图像,手势允许你与它交互.手势输入允许你使用手或者点击器原生地与全息图像交互. 手势之外,你也可以在应用中使用语音输入来交互. ...

  2. HoloLens开发手记 - Unity之Keyboard input 键盘输入

    虽然HoloLens支持很多种输入方式,包括蓝牙键盘在内.但是大部分应用还是不能断定用户有物理键盘可以输入,所以虚拟键盘输入还是必须要提供的. Unity提供了一个TouchScreenKeyboar ...

  3. HoloLens开发手记-开发概述Development overview

    开发HoloLens全息应用将使用UWP平台(Universal Windows Platform),所有的HoloLens应用都是Win10通用应用,所有UWP通用应用都可以在HoloLens上运行 ...

  4. HoloLens开发手记 - HoloLens真机上手简评

    千呼万唤始出来,终于今天拿到了HoloLens真机. 使用体验 使用自带的应用录制了一段使用视频,如下 设备概览 包装盒 本体 试戴 实际效果 GalaxyExplorer试玩 全息图像贴到现实场景表 ...

  5. HoloLens开发手记 - Unity之语音输入

    对于HoloLens,语音输入是三大基本输入方式之一,广泛地运用在各种交互中.HoloLens上语音输入有三种形式,分别是: 语音命令 Voice Command 听写 Diction 语法识别 Gr ...

  6. HoloLens开发手记 - Unity development overview 使用Unity开发概述

    Unity Technical Preview for HoloLens最新发行版为:Beta 24,发布于 09/07/2016 开始使用Unity开发HoloLens应用之前,确保你已经安装好了必 ...

  7. HoloLens开发手记 - 测试 Testing

    测试HoloLens应用的做法和测试Windows应用很类似.所有常规的内容都应该被考虑在内(功能.互操作性.性能.安全性.可靠性等等),然而有些特性是HoloLens特有的,在PC或者手机上无法测试 ...

  8. HoloLens开发手记 - Unity之Gestures手势识别

    手势识别是HoloLens交互的重要输入方法之一.HoloLens提供了底层API和高层API,可以满足不同的手势定制需求.底层API能够获取手的位置和速度信息,高层API则借助手势识别器来识别预设的 ...

  9. HoloLens开发手记 - 构建2D应用 Building 2D apps

    HoloLens可以让我们在真实世界中看到全息图像内容.但是它本质上还是一台Windows 10设备,这意味着HoloLens可以以2D应用形式运行Windows Store里的大部分UWP应用. 目 ...

随机推荐

  1. java-web的请求和响应机制中的request请求

     1 Request对象和Response对象的原理 1.1  都是由服务器创建的  我们使用它 1.2 Request对象  是获取请求消息 response对象是响应 2 request 对象的继 ...

  2. 7za命令报错Error: xxx is not supported archive

    问题: 执行7za命令时报错:Error: xxx is not supported archive   原因: 当前7za版本过低   直接执行7za可以看到当前版本: 7-Zip (A) [64] ...

  3. CSS如何作小于1PX的边

    小于1PX的边能使页面变得更加精致,那么具体怎么做呢? 主要思路就是设置伪元素先放大再通过变换缩小. 代码如下 .border { position: relative;//如果有圆角 } .bord ...

  4. python基础 ---- 使用pyCharm 调试

    debug -- 为了分析程序的异常 单步调试 1.设置断点 2.debug.启动  3.监控变量

  5. 244. Shortest Word Distance II 实现数组中的最短距离单词

    [抄题]: Design a class which receives a list of words in the constructor, and implements a method that ...

  6. [leetcode]84. Largest Rectangle in Histogram直方图中的最大矩形

    Given n non-negative integers representing the histogram's bar height where the width of each bar is ...

  7. Django formset

    一 什么是formset Form组件或ModelForm用于做一个表单验证而formset是用于做多个表单的验证组件,用于做批量操作 二 formset的使用方法 1 设置form信息 class ...

  8. dfs | Security Badges

    Description You are in charge of the security for a large building, with n rooms and m doors between ...

  9. Connection lost: The server closed the connection

    想必很多初学者都会遇到这个问题 其实很简单.mysql有个机制,就是8小时无通信,myslq就会自动关闭数据; 解决方案(2选1): 或者: 1.定时去做一个查询,就是 select * from X ...

  10. 去掉手机端延迟300ms

    手机端300ms延迟是由于在手机上可以双击可以放大缩小造成的,当初ios苹果的工程师们做了一些约定,应对 iPhone 这种小屏幕浏览桌面端站点的问题.这就是手机端300ms延迟的由来. 解决:我是用 ...