Xp下麦克风设备及音量检测
从Vista开始,windows底层的音频架构发生了改变:原本是底层API的waveXXX、mixerXXX等都在Core Audio APIs的基础上进行了重构,上升为了高层API;底层API变为Core Audio API。 由于这个原因,在利用遗留音频技术(waveXXX、mixerXXX等)进行开发的时候,在WinXp和其他系统上的表现会不太一致。
但是如果要在Xp上进行开发的话,就必须要使用这些老旧的技术,没得选。
Xp下音频开发选择
在Xp下进行开发,大概只有DirectX、waveXXX和mixerXXX可选了。 这里我们简单描述它们的优缺点:
优点:
- DirectX: 功能强大、灵活。
- waveXXX: 使用简单,对于输入音频设备,应用中的大部分功能需求都支持。
- mixerXXX: 完全底层的音频控制。
缺点:
- DirectX: 概念多、不容易上手(灵活的代价)。
- waveXXX: 对输入音频的控制处于应用层,无法控制系统层的音频输入(输出设备未测试)。
- mixerXXX: 概念多并且比较抽象,API的使用很晦涩。
Xp下输入音频开发实例
我们选择waveXXX api来实现这个开发实例,因为waveXXX相对来说比较好用,这样我们不用花费过多的时间去了解其他概念上的细节。
1. 设备枚举及打开
先调用waveInGetNumDevs()获取设备总数,然后传入设备序号(0 ~ 总数-1),并选择设备支持的PCM数据格式中的一种打开设备,获取到设备句柄:
auto inputAudioDeviceNum = waveInGetNumDevs();
for (int i = 0; i < inputAudioDeviceNum; ++i) {
WAVEINCAPS waveInCaps;
auto returnValue = waveInGetDevCaps(i, &waveInCaps, sizeof(waveInCaps)) ;
......
WAVEFORMATEX waveFormatEx = chooseAppropriateFormat();
auto returnValue = waveInOpen((LPHWAVEIN)&deviceInfo.handle, index, &waveFormatEx,
(DWORD_PTR)CoreAudioHelper::waveInProc,
(DWORD_PTR)this,
CALLBACK_FUNCTION);
......
}
2. 获取输入音频数据
为了获取音频数据,我们需要准备一个Buffer,并将这个Buffer添加到你想要获取数据的音频设备上,然后开始这个设备的音频捕获:
bool CoreAudioHelper::startPeakGetter()
{
Q_ASSERT(m_currentDeviceIndex >= 0 && m_currentDeviceIndex < m_infos.size());
auto& deviceInfo = m_infos[m_currentDeviceIndex];
ZeroMemory(m_buffer, sizeof(m_buffer));
m_waveHdr.dwFlags = 0;
m_waveHdr.lpData = (LPSTR)m_buffer;
m_waveHdr.dwBufferLength = sizeof(m_buffer);
auto returnValue = waveInPrepareHeader(deviceInfo.handle, &m_waveHdr, sizeof(m_waveHdr));
CHECK_RETURN(returnValue);
returnValue = waveInAddBuffer(deviceInfo.handle, &m_waveHdr, sizeof(m_waveHdr));
CHECK_RETURN(returnValue);
returnValue = waveInStart(deviceInfo.handle);
CHECK_RETURN(returnValue);
deviceInfo.started = true;
return true;
}
当这个Buffer被数据填满的时候,系统就会通知你,这时候我们需要先调用waveInUnprepareHeader()来取消先前准备的Buffer,然后就可以对数据进行操作了(这里我们计算了音频的音量大小)。在之前打开设备的时候,你可以选择多种通知方式:回调、窗口消息、事件或者线程,这里我选择使用回调方法。如果要连续的获取捕获到的数据,我们就要在Buffer被填满的时候不断添加新的Buffer。注意因为在回调中基本上不可以调用任何系统api,所以我们需要另一个线程来添加新Buffer,并利用信号量来进行同步:
void CoreAudioHelper::waveInProc(HWAVEIN hwi, UINT uMsg, DWORD_PTR dwInstance, DWORD_PTR dwParam1, DWORD_PTR dwParam2)
{
switch (uMsg) {
case WIM_OPEN:
break;
case WIM_CLOSE:
{
......
}
case WIM_DATA:
{
......
break;
}
default:
Q_ASSERT(false && "never receive other msg!");
}
}
// non-qt thread have no qt event loop which causing signal/slot not working,
// we use a queue to keep the value and a semaphore to notify the internal thread
// to emit the signal.
void CoreAudioHelper::appendPeakValue(qint16 value)
{
m_peakValueQueue.push(value);
// cannot call Win32 api inside a callback, so we notify the buffer waiter thread
m_bufferFilled.release(1);
}
void CoreAudioHelper::BufferWaiterThread::run()
{
while (true) {
m_helper->m_bufferFilled.acquire(1);
m_helper->unprepareBuffer();
if (m_helper->m_stopThread)
break;
if (m_helper->m_emitUnplugged) {
emit m_helper->currentDeviceUnplugged();
m_helper->m_emitUnplugged = false;
break;
}
m_helper->emitPeakLevelAndContinue();
}
}
bool CoreAudioHelper::unprepareBuffer()
{
auto deviceInfo = m_infos.at(m_currentDeviceIndex);
auto returnValue = waveInUnprepareHeader(deviceInfo.handle, &m_waveHdr, sizeof(m_waveHdr));
CHECK_RETURN(returnValue);
return true;
}
3. 音量大小计算
根据PCM数据是8位还是16位,我们把Buffer中的比特数据转换成合适的变量并计算保存最小值和最大值。因为实际音频波形是以0点为水平上下波动的,

- 8位PCM: 无符号数据,范围0~255, 水平值127。
- 16位PCM: 有符号数据,范围-32767~32767,水平值0。
我们只需要把最大波动值除以上限值就可以获得音量大小了(具体见下一小节)。
// buffer already filled with input audio data
CoreAudioHelper* helper = reinterpret_cast<CoreAudioHelper*>(dwInstance);
Q_ASSERT(helper->m_waveHdr.dwFlags & WHDR_DONE);
qint32 peakMin = 255;
qint32 peakMax = 0;
for (char* ptr = helper->m_buffer; ptr < &helper->m_buffer[16]; ) {
qint32 dataValue;
if (helper->m_is8BitsSample) {
dataValue = *(unsigned char*)ptr;
ptr++;
} else {
dataValue = *(qint16*)ptr;
ptr += 2;
}
if (dataValue < peakMin) peakMin = dataValue;
if (dataValue > peakMax) peakMax = dataValue;
}
helper->appendPeakValue(max(-peakMin, peakMax));
4. 音量设置和静音
waveXXX API只提供了音频数据捕获,因此我们需要自己来模拟音量和静音的控制,这里我们把这些控制应用在获取到的音量大小上:
void CoreAudioHelper::emitPeakLevelAndContinue()
{
if (!m_peakValueQueue.empty()) {
qint32 peakValue = m_peakValueQueue.front();
m_peakValueQueue.pop();
if (!m_infos.at(m_currentDeviceIndex).muted) {
if (m_is8BitsSample) {
// when 8-bit sample, the range is 0--255, the silence data value is 127
emit peakChanged(qint32(abs(peakValue - 127) / 1.27) *
m_infos.at(m_currentDeviceIndex).volumeFilterPercent);
}
else {
// when 16-bit sample, the range is -32767--32767, the silence data value is 0
emit peakChanged(qint32(abs(peakValue) / 327.67) *
m_infos.at(m_currentDeviceIndex).volumeFilterPercent);
}
startPeakGetter();
}
}
}
5. 运行结果
结果就是这样啦,完整代码见此处。

Xp下麦克风设备及音量检测的更多相关文章
- Linux下usb设备驱动详解
USB驱动分为两块,一块是USB的bus驱动,这个东西,Linux内核已经做好了,我们可以不管,我们只需要了解它的功能.形象的说,USB的bus驱动相当于铺出一条路来,让所有的信息都可以通过这条USB ...
- 在XP下基于VHD版XP 2003 win7制作的RAMOS心得
在XP下基于VHD版win7制作的RAMOS心得1.用DiskGenius创建1.85G的VHD固定磁盘文件,以win7prosen.vhd为例,然后进行分区格式化,格式化时启用NTFS压缩.2.为了 ...
- ubuntu 在XP下硬盘安装
以下选择在XP下用 grub4dos 安装 ubuntu 12.04版本 需要下载两个文件:一个是grub4dos,另一个是 ubutuntu 镜像文件 grub4dos下载地址:http://dow ...
- Windows XP下安装WinCE6.0开发环境
Windows下怎样编译WinCE6.0及开发应用程序.以下介绍(安装之前必须保证C盘有足够的空间!20g左右!主要是由于在安装程序在安装过程中要解压): 在Visual Studio 2005之前, ...
- Node.js 操作 OSX 系统麦克风、扬声器音量
最近几年 Electron 很火,公司也正好有个项目想做跨平台客户端,大家研究了一下就选择了 Electron,第一次做 js 的项目遇到了不少坑,不过也都一点点解决了. 因为项目中需要对用户录音,H ...
- 【DSP开发】【Linux开发】Linux下PCI设备驱动程序开发
PCI是一种广泛采用的总线标准,它提供了许多优于其它总线标准(如EISA)的新特性,目前已经成为计算机系统中应用最为广泛,并且最为通用的总线标准.Linux的内核能较好地支持PCI总线,本文以Inte ...
- xp 下查看进程指令
xp 下快速查看进程及关联 exe 的指令,刚发现,还没有测试 win7 和 win10 支持不支持. wmic process where creationclassname="win32 ...
- 【求助】WPF 在XP下 有的Textbox光标会消失
最近做个项目,一直有一个问题没有解决,就是在XP下,有的Textbox里在文本框里没有东西的时候,会没有光标.不同的XP机器,失去光标的Textbox也不一样. 各位大师看下面的三张图,当Textbo ...
- 使用Windbg在XP下Heap追踪失败的原因
1.故事背景 最近同事的代码中碰到一个bug会导致奔溃的bug,从dump上看是由于某个对象的堆内存指针被释放了,但代码仍调用了该对象指针的虚函数,从而引起内存访问违法崩溃,由于该类被大量使 ...
随机推荐
- 九度OJ 1013 开门人和关门人
#include <iostream> #include <string.h> #include <sstream> #include <math.h> ...
- 201521123066 《Java程序设计》 第六周学习总结
1. 本周学习总结 1.1 面向对象学习暂告一段落,请使用思维导图,以封装.继承.多态为核心概念画一张思维导图,对面向对象思想进行一个总结. 1.clone方法 1.1 Object对象中的clone ...
- 201521123096《Java程序设计》第三周学习总结
1. 本周学习总结 2. 书面作业 (1)代码阅读 public class Test1 { private int i = 1;//这行不能修改 private static int j = 2; ...
- java程序设计-算术表达式的运算
1.团队课程设计博客链接 洪亚文博客链接:http://www.cnblogs.com/201521123065hyw/ 郑晓丽博客链接:http://www.cnblogs.com/zxl3066/ ...
- 201521123116 《java程序设计》第十二周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容. 2. 书面作业 Q1.字符流与文本文件:使用 PrintWriter(写),BufferedReader(读) ...
- 201521123029《Java程序设计》第十一周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多线程相关内容. 2. 书面作业 1.互斥访问与同步访问 完成题集4-4(互斥访问)与4-5(同步访问) 1.1 除了使用synch ...
- CSS3滤镜(filter--CSS3技术
filter 属性定义了元素(通常是<img>)的可视效果,例如图片的模糊.饱和度.灰度等……个人感觉功能很强大 1.filter的语法 filter: none | blur() | b ...
- ExtJS4为form表单必填项添加红色*标识
通常情况下,ExtJS4的form表单必填项在输入状态下会有特殊提示,非输入状态下,显示却和其他项没有任何区别.为使必填项更加容易区分,我们需要根据allowBlank的属性值,为form表单中的必填 ...
- python入门之一python安装及程序运行
Python 程序要运行,需要先安装python解释器 PVM(这里可对照java的JVM来理解)实际上,你不需要单独安装,直接安装python后就可以了 1.安装python 下载地址:http:/ ...
- Configuration Extensions - 简化配置,让你配置支持变量
在开发"RabbitCloud"项目时,使用配置文件发现会有很多重复值,所以我基于"Microsoft.Extensions.Configuration"写了一 ...