语音是HoloLens三大重要输入形式之一。它允许你直接通过语言控制全息图像,而不用借助手势。你只要凝视全息图像然后说出语音命令即可。语音输入是自然的交互方式,它能够很好的改善复杂的交互,因为通过一条语音命令即可以减少很多复杂的UI菜单。

HoloLens语音输入是由同UWP应用一样的语音识别引擎支持。

选中命令 The "select" command


即使没有特地为应用添加语音命令特性,用户还是能够通过说:“select”来简单地激活你的全息图像。这个行为和用手或点击器点击类似。你将会听到一声提示音,同时会看到一条提示:“Select”,用以确认你的语音指令。“Select”命令是由低功耗关键词识别算法来保证的,所以任何时候你都能使用它,这只会带来极低的电量生命周期影响。

激活Cortana Hey Cortana


任何时候你都可以通过说:"Hey Cortana"来激活它,并且不用等待它出现,即可继续问它问题或给出指令。关于Cortana的更多信息和你能做什么,你直接询问它即可。可以说:"Hey Cortana, What Can I Say?",然后它会更出作业和推荐的语音命令列表。如果你已经进入Cortana应用,点击 ? 按钮同样可以获得提示列表。

HoloLens特定语音命令 HoloLens-specific commands

  • Go Home - 唤出开始菜单
  • Launch <应用名> - 打开应用
  • Take a picture
  • Start recording
  • Stop record
  • Increase the brightness
  • Decrease the brightness
  • Increase the volume
  • Decrease the volume
  • Shut down the device
  • Restart the device
  • Reboot the device
  • Go to sleep
  • What time is it?
  • What is my IP address?
  • Am I connected to the network?
  • Are you listening?
  • How much battery do I have left?
  • Call <联系人> - 需要安装HoloSkype
  • Web search

"See It, Say It"模式


对于语音输入,HoloLens有一个"See It, Say It"模式,在此模式内按钮上会出现文本提示来告诉用户应该使用什么语音命令来使用它。例如,我们看向一个2D应用,当我们看到Holobar上的Adjust按钮时,会出现文本提示框,此时我们直接说:"Adjust"命令即可调整应用在世界中的位置。

当应用遵循此规则时,用户可以很容易地明白应该说什么命令来控制系统。为了加强此特性,当用户凝视按钮时,你可以显示一个语音命令提示栏,来使用户明白此按钮支持语音输入同时明白应该说什么指令。

语音转文字 Dictation


和通过点击手势输入一样,语音听写能够更有效地在应用中输入文本。这能更好地加快用户输入,以减少输入对用户体验的影响。

任何时候全息键盘激活后,你都能将输入模式切换到听写模式。可以通过点击文本输入框左边的麦克风按钮来开始听写操作。

通信 Communication


对于那些想要使用HoloLens自定义语音输入处理选项的应用来讲,理解音频流类别(audio stream categories)很重要。Windows 10支持数种音频流类别,同时为了优化为语音输入、通信和其他辅助周边环境音频捕获场景量身定制的麦克风音频质量,HoloLens支持其中3种类别来保证自定义音频处理。

  • AudioCategory_Communications流类别被自定义用于通话质量和叙述场景,提供给客户端用户声音的16kHz 24位单声道音频流.
  • AudioCategory_Speech流类别被定制用于HoloLens(Windows)语音识别引擎,提供它们 16kHz 24位单声道用户音频流。如果需要的话,此流类别亦可用于第三方语音识别引擎。
  • AudioCategory_Other流类别被定制用于周边环境声音录制,提供给客户端 48kHz 24位立体声音频流。

所有的音频处理都通过硬件加速,这意味着此特性会大大降低电池消耗,如果与CPU处理同样音频作业相比的话。通过避免在CPU上处理其他音频输入进程,可以最大化系统电池生命周期,同时能够利用上内置的音频处理作业。

问题诊断 Troubleshooting


如果你在使用"select"和"Hey Cortana"语音命令中遇到任何问题,请尝试移动到安静的空间,远离噪音来源,或者尝试大声说话。此时,HoloLens上所有的语音识别都将特地为美式英语调整和优化。

HoloLens开发手记 - 语音输入 Voice input的更多相关文章

  1. HoloLens开发手记 - 手势输入 Gesture input

    手势是HoloLens三个首要输入形式之一.一旦你使用凝视定位了一个全息图像,手势允许你与它交互.手势输入允许你使用手或者点击器原生地与全息图像交互. 手势之外,你也可以在应用中使用语音输入来交互. ...

  2. HoloLens开发手记 - Unity之Keyboard input 键盘输入

    虽然HoloLens支持很多种输入方式,包括蓝牙键盘在内.但是大部分应用还是不能断定用户有物理键盘可以输入,所以虚拟键盘输入还是必须要提供的. Unity提供了一个TouchScreenKeyboar ...

  3. HoloLens开发手记-开发概述Development overview

    开发HoloLens全息应用将使用UWP平台(Universal Windows Platform),所有的HoloLens应用都是Win10通用应用,所有UWP通用应用都可以在HoloLens上运行 ...

  4. HoloLens开发手记 - HoloLens真机上手简评

    千呼万唤始出来,终于今天拿到了HoloLens真机. 使用体验 使用自带的应用录制了一段使用视频,如下 设备概览 包装盒 本体 试戴 实际效果 GalaxyExplorer试玩 全息图像贴到现实场景表 ...

  5. HoloLens开发手记 - Unity之语音输入

    对于HoloLens,语音输入是三大基本输入方式之一,广泛地运用在各种交互中.HoloLens上语音输入有三种形式,分别是: 语音命令 Voice Command 听写 Diction 语法识别 Gr ...

  6. HoloLens开发手记 - Unity development overview 使用Unity开发概述

    Unity Technical Preview for HoloLens最新发行版为:Beta 24,发布于 09/07/2016 开始使用Unity开发HoloLens应用之前,确保你已经安装好了必 ...

  7. HoloLens开发手记 - 测试 Testing

    测试HoloLens应用的做法和测试Windows应用很类似.所有常规的内容都应该被考虑在内(功能.互操作性.性能.安全性.可靠性等等),然而有些特性是HoloLens特有的,在PC或者手机上无法测试 ...

  8. HoloLens开发手记 - Unity之Gestures手势识别

    手势识别是HoloLens交互的重要输入方法之一.HoloLens提供了底层API和高层API,可以满足不同的手势定制需求.底层API能够获取手的位置和速度信息,高层API则借助手势识别器来识别预设的 ...

  9. HoloLens开发手记 - 构建2D应用 Building 2D apps

    HoloLens可以让我们在真实世界中看到全息图像内容.但是它本质上还是一台Windows 10设备,这意味着HoloLens可以以2D应用形式运行Windows Store里的大部分UWP应用. 目 ...

随机推荐

  1. Xshell 6安装与使用教程

    随着xshell5出现评估期已过的问题,发现好多人不知道怎么下载免费版的Xshell,在这里我将详细告诉大家如何下载和安装最新的Xshell6远程管理工具. Xshell安装 1.进入xshell英文 ...

  2. 【python深入】单例模式

    单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保某一个类只有一个实例存在.当你希望在整个系统中,某个类只能出现一个实例时,单例对象就能派上用场. 比如,某 ...

  3. nignx知识点总结

    https://segmentfault.com/a/1190000013781162

  4. 694. Number of Distinct Islands 形状不同的岛屿数量

    [抄题]: Given a non-empty 2D array grid of 0's and 1's, an island is a group of 1's (representing land ...

  5. [leetcode]94. Binary Tree Inorder Traversal二叉树中序遍历

    Given a binary tree, return the inorder traversal of its nodes' values. Example: Input: [1,null,2,3] ...

  6. input 随笔

    1,input 点击出现蓝色外边框 解决:outline:none

  7. 用TSQL从sqlserve 发布订阅链中删除一张或几张表

    一个简单的存储过程,用来实现从一个SQLSERVE 发布订阅链中删除一张或几张表. /* 1.停日志读取代理 2.exec usp_从复制订阅中删除表 'dbtestPub','test1' 3.开日 ...

  8. AI制作icon标准参考线与多面板复制

    新建10个25x25像素,色值为RGB的画板 在视图中打开显示网格 打开首选项参考线和网格,间隔和隔线都设为1 新建一个20x20像素前景色为空描边为1像素的正方形 选择对齐选项中的对齐画板,使之与画 ...

  9. 网站日志流量分析采集(LuaJIT系统环境部署-node03,相关jar包自己手动上传)

    注:/usr/local/src 是源码包路径,可以自己更改 服务器中安装依赖 yum -y install gcc perl pcre-devel openssl openssl-devel 上传 ...

  10. 【MarkMark学习笔记学习笔记】javascript/js 学习笔记

    1.0, 概述.JavaScript是ECMAScript的实现之一 2.0,在HTML中使用JavaScript. 2.1 3.0,基本概念 3.1,ECMAScript中的一切(变量,函数名,操作 ...