从Vista开始,windows底层的音频架构发生了改变:原本是底层API的waveXXX、mixerXXX等都在Core Audio APIs的基础上进行了重构,上升为了高层API;底层API变为Core Audio API。 由于这个原因,在利用遗留音频技术(waveXXX、mixerXXX等)进行开发的时候,在WinXp和其他系统上的表现会不太一致。

但是如果要在Xp上进行开发的话,就必须要使用这些老旧的技术,没得选。

Xp下音频开发选择

在Xp下进行开发,大概只有DirectX、waveXXX和mixerXXX可选了。 这里我们简单描述它们的优缺点:

优点:

  • DirectX: 功能强大、灵活。
  • waveXXX: 使用简单,对于输入音频设备,应用中的大部分功能需求都支持。
  • mixerXXX: 完全底层的音频控制。

缺点:

  • DirectX: 概念多、不容易上手(灵活的代价)。
  • waveXXX: 对输入音频的控制处于应用层,无法控制系统层的音频输入(输出设备未测试)。
  • mixerXXX: 概念多并且比较抽象,API的使用很晦涩。

Xp下输入音频开发实例

我们选择waveXXX api来实现这个开发实例,因为waveXXX相对来说比较好用,这样我们不用花费过多的时间去了解其他概念上的细节。

1. 设备枚举及打开

先调用waveInGetNumDevs()获取设备总数,然后传入设备序号(0 ~ 总数-1),并选择设备支持的PCM数据格式中的一种打开设备,获取到设备句柄:

auto inputAudioDeviceNum = waveInGetNumDevs();
for (int i = 0; i < inputAudioDeviceNum; ++i) {
WAVEINCAPS waveInCaps;
auto returnValue = waveInGetDevCaps(i, &waveInCaps, sizeof(waveInCaps)) ; ...... WAVEFORMATEX waveFormatEx = chooseAppropriateFormat();
auto returnValue = waveInOpen((LPHWAVEIN)&deviceInfo.handle, index, &waveFormatEx,
(DWORD_PTR)CoreAudioHelper::waveInProc,
(DWORD_PTR)this,
CALLBACK_FUNCTION);
......
}

2. 获取输入音频数据

为了获取音频数据,我们需要准备一个Buffer,并将这个Buffer添加到你想要获取数据的音频设备上,然后开始这个设备的音频捕获:

bool CoreAudioHelper::startPeakGetter()
{
Q_ASSERT(m_currentDeviceIndex >= 0 && m_currentDeviceIndex < m_infos.size());
auto& deviceInfo = m_infos[m_currentDeviceIndex]; ZeroMemory(m_buffer, sizeof(m_buffer));
m_waveHdr.dwFlags = 0;
m_waveHdr.lpData = (LPSTR)m_buffer;
m_waveHdr.dwBufferLength = sizeof(m_buffer); auto returnValue = waveInPrepareHeader(deviceInfo.handle, &m_waveHdr, sizeof(m_waveHdr));
CHECK_RETURN(returnValue); returnValue = waveInAddBuffer(deviceInfo.handle, &m_waveHdr, sizeof(m_waveHdr));
CHECK_RETURN(returnValue); returnValue = waveInStart(deviceInfo.handle);
CHECK_RETURN(returnValue); deviceInfo.started = true;
return true;
}

当这个Buffer被数据填满的时候,系统就会通知你,这时候我们需要先调用waveInUnprepareHeader()来取消先前准备的Buffer,然后就可以对数据进行操作了(这里我们计算了音频的音量大小)。在之前打开设备的时候,你可以选择多种通知方式:回调、窗口消息、事件或者线程,这里我选择使用回调方法。如果要连续的获取捕获到的数据,我们就要在Buffer被填满的时候不断添加新的Buffer。注意因为在回调中基本上不可以调用任何系统api,所以我们需要另一个线程来添加新Buffer,并利用信号量来进行同步

void CoreAudioHelper::waveInProc(HWAVEIN hwi, UINT uMsg, DWORD_PTR dwInstance, DWORD_PTR dwParam1, DWORD_PTR dwParam2)
{
switch (uMsg) {
case WIM_OPEN:
break;
case WIM_CLOSE:
{
......
}
case WIM_DATA:
{
......
break;
}
default:
Q_ASSERT(false && "never receive other msg!");
} } // non-qt thread have no qt event loop which causing signal/slot not working,
// we use a queue to keep the value and a semaphore to notify the internal thread
// to emit the signal.
void CoreAudioHelper::appendPeakValue(qint16 value)
{
m_peakValueQueue.push(value);
// cannot call Win32 api inside a callback, so we notify the buffer waiter thread
m_bufferFilled.release(1);
} void CoreAudioHelper::BufferWaiterThread::run()
{
while (true) {
m_helper->m_bufferFilled.acquire(1); m_helper->unprepareBuffer(); if (m_helper->m_stopThread)
break;
if (m_helper->m_emitUnplugged) {
emit m_helper->currentDeviceUnplugged();
m_helper->m_emitUnplugged = false;
break;
}
m_helper->emitPeakLevelAndContinue();
}
} bool CoreAudioHelper::unprepareBuffer()
{
auto deviceInfo = m_infos.at(m_currentDeviceIndex);
auto returnValue = waveInUnprepareHeader(deviceInfo.handle, &m_waveHdr, sizeof(m_waveHdr));
CHECK_RETURN(returnValue);
return true;
}

3. 音量大小计算

根据PCM数据是8位还是16位,我们把Buffer中的比特数据转换成合适的变量并计算保存最小值和最大值。因为实际音频波形是以0点为水平上下波动的,

  • 8位PCM: 无符号数据,范围0~255, 水平值127。
  • 16位PCM: 有符号数据,范围-32767~32767,水平值0。

我们只需要把最大波动值除以上限值就可以获得音量大小了(具体见下一小节)。

//  buffer already filled with input audio data
CoreAudioHelper* helper = reinterpret_cast<CoreAudioHelper*>(dwInstance);
Q_ASSERT(helper->m_waveHdr.dwFlags & WHDR_DONE); qint32 peakMin = 255;
qint32 peakMax = 0;
for (char* ptr = helper->m_buffer; ptr < &helper->m_buffer[16]; ) {
qint32 dataValue;
if (helper->m_is8BitsSample) {
dataValue = *(unsigned char*)ptr;
ptr++;
} else {
dataValue = *(qint16*)ptr;
ptr += 2;
}
if (dataValue < peakMin) peakMin = dataValue;
if (dataValue > peakMax) peakMax = dataValue;
} helper->appendPeakValue(max(-peakMin, peakMax));

4. 音量设置和静音

waveXXX API只提供了音频数据捕获,因此我们需要自己来模拟音量和静音的控制,这里我们把这些控制应用在获取到的音量大小上:

void CoreAudioHelper::emitPeakLevelAndContinue()
{
if (!m_peakValueQueue.empty()) {
qint32 peakValue = m_peakValueQueue.front();
m_peakValueQueue.pop(); if (!m_infos.at(m_currentDeviceIndex).muted) {
if (m_is8BitsSample) {
// when 8-bit sample, the range is 0--255, the silence data value is 127
emit peakChanged(qint32(abs(peakValue - 127) / 1.27) *
m_infos.at(m_currentDeviceIndex).volumeFilterPercent);
}
else {
// when 16-bit sample, the range is -32767--32767, the silence data value is 0
emit peakChanged(qint32(abs(peakValue) / 327.67) *
m_infos.at(m_currentDeviceIndex).volumeFilterPercent);
}
startPeakGetter();
}
}
}

5. 运行结果

结果就是这样啦,完整代码见此处

Xp下麦克风设备及音量检测的更多相关文章

  1. Linux下usb设备驱动详解

    USB驱动分为两块,一块是USB的bus驱动,这个东西,Linux内核已经做好了,我们可以不管,我们只需要了解它的功能.形象的说,USB的bus驱动相当于铺出一条路来,让所有的信息都可以通过这条USB ...

  2. 在XP下基于VHD版XP 2003 win7制作的RAMOS心得

    在XP下基于VHD版win7制作的RAMOS心得1.用DiskGenius创建1.85G的VHD固定磁盘文件,以win7prosen.vhd为例,然后进行分区格式化,格式化时启用NTFS压缩.2.为了 ...

  3. ubuntu 在XP下硬盘安装

    以下选择在XP下用 grub4dos 安装 ubuntu 12.04版本 需要下载两个文件:一个是grub4dos,另一个是 ubutuntu 镜像文件 grub4dos下载地址:http://dow ...

  4. Windows XP下安装WinCE6.0开发环境

    Windows下怎样编译WinCE6.0及开发应用程序.以下介绍(安装之前必须保证C盘有足够的空间!20g左右!主要是由于在安装程序在安装过程中要解压): 在Visual Studio 2005之前, ...

  5. Node.js 操作 OSX 系统麦克风、扬声器音量

    最近几年 Electron 很火,公司也正好有个项目想做跨平台客户端,大家研究了一下就选择了 Electron,第一次做 js 的项目遇到了不少坑,不过也都一点点解决了. 因为项目中需要对用户录音,H ...

  6. 【DSP开发】【Linux开发】Linux下PCI设备驱动程序开发

    PCI是一种广泛采用的总线标准,它提供了许多优于其它总线标准(如EISA)的新特性,目前已经成为计算机系统中应用最为广泛,并且最为通用的总线标准.Linux的内核能较好地支持PCI总线,本文以Inte ...

  7. xp 下查看进程指令

    xp 下快速查看进程及关联 exe 的指令,刚发现,还没有测试 win7 和 win10 支持不支持. wmic process where creationclassname="win32 ...

  8. 【求助】WPF 在XP下 有的Textbox光标会消失

    最近做个项目,一直有一个问题没有解决,就是在XP下,有的Textbox里在文本框里没有东西的时候,会没有光标.不同的XP机器,失去光标的Textbox也不一样. 各位大师看下面的三张图,当Textbo ...

  9. 使用Windbg在XP下Heap追踪失败的原因

    1.故事背景      最近同事的代码中碰到一个bug会导致奔溃的bug,从dump上看是由于某个对象的堆内存指针被释放了,但代码仍调用了该对象指针的虚函数,从而引起内存访问违法崩溃,由于该类被大量使 ...

随机推荐

  1. CSS3弹性盒模型 display:box

    刚开始做网页时就有一个困惑,为什么display:block只能垂直排列,如果要水平排列就要使用float:left等方式.这种方法最难受的当然是当子元素的数量改变时,需要去修改子元素的宽度使重新适应 ...

  2. python-分页代码

    page.py ''' django内使用方式: all_count = models.UserInfo.objects.all().count() # path_info 当前页的url # all ...

  3. 【2017集美大学1412软工实践_助教博客】团队作业10——项目复审与事后分析(Beta版本)

    写在前面的话 转眼轰轰烈烈本学期的软工实践就结束了,这个过程中想必在熬夜敲代码,激烈讨论中留下诸多回忆的同时,也收获了不少.恭喜所有团队完成了本阶段冲刺,此外,由于大家的贡献分给的都很平均,将个人贡献 ...

  4. 团队作业9——展示博客(Beta版本)

    展示博客 1.团队成员的简介和个人博客地址,团队的源码仓库地址. 何琴琴(http://www.cnblogs.com/vviane/): 领导项目进行,协调各队员之间的矛盾合作,负责测试与需求分析. ...

  5. 201521123091 《Java程序设计》第11周学习总结

    Java 第十一周总结 第十一周的作业. 目录 1.本章学习总结 2.Java Q&A 3.码云上代码提交记录及PTA实验总结 4.课后阅读 1.本章学习总结 1.1 以你喜欢的方式(思维导图 ...

  6. 201521123060 《Java程序设计》第12周学习总结

    1.本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容. 2.书面作业 将Student对象(属性:int id, String name,int age,double ...

  7. 练习使用markdown

    我的随笔 写随笔的原因 1 完全是为了练习使用markdown编辑器 2 我是个爱学习的宝宝 3 学习能力问题? 随笔内容 弄懂markdown语法 随便谢谢心情 个人心情 冷漠 不想说话 神经 个人 ...

  8. pygame 弹力球及其变速的实现

    期望: 1.球体接触到框体后反弹 2.设置速度按键,按下后改变球体速度.颜色状态 具体实现: import pygame from pygame.locals import * import sys, ...

  9. mysql查询文章的评论数量

    作为小白的我,这个问题弄了半天才解决,特此记录下. 两张表:文章表和评论表 文章表(article):id 评论表(comment):id,c_aid 要求:查询出所有文章及评论数量然后降序显示(没有 ...

  10. Activiti第三篇【连接、排他网关、指定任务处理人、组任务】

    连线 上面我们已将学过了流程变量了,可以在[任务服务.运行时服务.流程开始.完成某个任务时设置流程变量],而我们的连接就是流程变量的实际应用了-. 定义流程图 我们并不是所有的流程都是按一条的路径来走 ...