Tiny6410声卡驱动——录音与回放
在Linux下,音频设备程序的实现与文件系统的操作密切相关。Linux将各种设备以文件的形式给出统一的接口,这样的设计使得对设备的编程与对文件的操作基本相同,对Linux内核的系统调用也基本一致,从而简化了设备编程。
如何对各种音频设备进行操作是在Linux上进行音频编程的关键,通过内核提供的一组系统调用,应用程序能够访问声卡驱动程序提供的各种音频设备接口,这是在Linux下进行音频编程最简单也是最直接的方法。
声卡不是Linux控制台的一部分,它是一个特殊的设备。声卡主要提供3个重要的特征:
- 数字取样输入/输出
- 频率调制输出
- MIDI接口
这3个特征都有它们自己的设备驱动程序接口
- 数字取样的接口是/dev/dsp
- 频率调制的接口/dev/sequencer
- MIDI接口是/dev/midi
混音设备(如音量、平衡或者贝斯)可以通过/dev/mixer接口来控制。
为了满足兼容性的需要,还提供了一个/dev/audio设备,该设备可用于读SUN_law的声音数据,但它是映射到数字取样设备的。
1、音频编程接口
程序员可以使用ioctl()来操作这些设备,ioctl()请求是在linux/soundcard.h中定义的,它们以SNDCTL_开头。
- 首先使用open系统调用建立起与硬件间的联系,此时返回的文件描述符将作为随后操作的标识;
- 接着使用read系统调用从设备接收数据,或者使用write系统调用向设备写入数据,而其他所有不符合读/写这一基本模式的操作都可以由ioctl系统调用来完成;
- 最后,使用close系统调用告诉Linux内核不会再对该设备做进一步的处理。
1.1.open系统调用
系统调用open可以获得对声卡的访问权,同时还能为随后的系统调用做好准备,其函数原型如下所示:
int open(const char *pathname, int flags, int mode);
- 参数pathname是将要被打开的设备文件的名称,对于声卡来讲一般是/dev/dsp。
- 参数flags用来指明应该以什么方式打开设备文件,它可以是O_RDONLY、O_WRONLY或者O_RDWR,分别表示以只读、只写或者读写的方式打开设备文件;
- 参数mode通常是可选的,它只有在指定的设备文件不存在时才会用到,指明新创建的文件应该具有怎样的权限。如果open系统调用能够成功完成,它将返回一个正整数作为文件标志符,在随后的系统调用中需要用到该标志符。
如果open系统调用失败,它将返回-1,同时还会设置全局变量errno,指明是什么原因导致了错误的发生。
1.2.read系统调用
read用来从声卡读取数据,其函数原型如下所示:
int read(int fd, char *buf, size_t count);
- 参数fd是设备文件的标志符,它是通过之前的open系统调用获得的;
- 参数buf是指向缓冲区的字符指针,它用来保存从声卡获得的数据;
- 参数count则用来限定从声卡获得的最大字节数。
如果read系统调用成功完成,它将返回从声卡实际读取的字节数,通常情况会比count的值小一些;如果read系统调用失败,它将返回-1,同时还会设置全局变量errno,来指明是什么原因导致了错误的发生。
1.3.write系统调用
write用来向声卡写入数据,其函数原型如下所示:
- 参数fd同样是设备文件的标志符,它也是通过之前的open系统调用获得的;
- 参数buf是指向缓冲区的字符指针,它保存着即将向声卡写入的数据;
- 参数count则用来限定向声卡写入的最大字节数。
1.4.ioctl系统调用
系统调用ioctl可以对声卡进行控制,凡是对设备文件的操作不符合读/写基本模式的,都是通过ioctl来完成的,它可以影响设备的行为,或者返回设备的状态,其函数原型如下所示:
- 参数fd是设备文件的标志符,它是在设备打开时获得的,如果设备比较复杂,那么对它的控制请求相应地也会有很多种,
- 参数request的目的就是用来区分不同的控制请求;
1.5.close系统调用
当应用程序使用完声卡之后,需要用close系统调用将其关闭,以便及时释放占用的硬件资源,其函数原型如下所示:
- 参数fd是设备文件的标志符,它是在设备打开时获得的。
2、音频设备文件
- /dev/sndstat
设备文件/dev/sndstat是声卡驱动程序提供的最简单的接口,通常它是一个只读文件,作用也仅仅只限于汇报声卡的当前状态。一般说来,/dev/sndstat是提供给最终用户来检测声卡的,不宜用于程序当中,因为所有的信息都可以通过ioctl系统调用来获得。
- /dev/dsp
声卡驱动程序提供的/dev/dsp是用于
数字采样和数字录音的设备文件,它对于Linux下的音频编程来讲非常重要。
向该设备写数据即意味着激活声卡上的D/A转换器进行放音,而从该设备读数据则意味着激活声卡上的A/D转换器进行录音。目前,许多声卡都提供有多个数字采样设备,它们在Linux下可以通过/dev/dsp等设备文件进行访问。
- /dev/audio
/dev/audio类似于/dev/dsp,它兼容于Sun工作站上的音频设备,使用的是mu-law编码方式。由于设备文件/dev/audio主要出于对兼容性的考虑,所以在新开发的应用程序中最好不要尝试用它,而应该以/dev/dsp进行替代。对于应用程序来说,同一时刻只能使用/dev/audio或者/dev/dsp其中之一,因为它们是
相同硬件的不同软件接口。
- /dev/mixer
在声卡的硬件电路中,混音器(mixer)是一个很重要的组成部分,它的作用是
将多个信号组合或者叠加在一起,对于不同的声卡来说,其混音器的作用可能各不相同。运行在Linux内核中的声卡驱动程序一般都会提供/dev/mixer这一设备文件,它是应用程序对混音器进行操作的软件接口。
- /dev/sequencer
目前大多数声卡驱动程序还会提供/dev/sequencer设备文件,用来对声卡内建的波表合成器进行操作,或者对MIDI总线上的乐器进行控制,通常只用于计算机音乐软件中。
3、音频设备编程设计
3.1.DSP编程
int handle = open("/dev/dsp", O_WRONLY);
if (handle == -1) {
perror("open /dev/dsp");
return -1;
}
运行在Linux内核中的声卡驱动程序专门维护了一个缓冲区,其大小会影响到放音和录音时的效果,使用ioctl系统调用可以对它的尺寸进行恰当的设置。调节驱动程序中缓冲区大小的操作不是必需的,如果没有特殊的要求,一般采用默认的缓冲区大小就可以了。但需要注意的是,
缓冲区大小的设置通常应紧跟在设备文件打开之后,这是因为对声卡的其他操作有可能会导致驱动程序无法再修改其缓冲区的大小。下面的代码示范了怎样设置声卡驱动程序中的内核缓冲区的大小:
int setting = 0xnnnnssss;
int result = ioctl(handle, SNDCTL_DSP_SETFRAGMENT, &setting);
if (result == -1) {
perror("ioctl buffer size");
return -1;
}
在设置缓冲区大小时,参数setting实际上由两部分组成,其低16位标明缓冲区的尺寸,相应的计算公式为buffer_size = 2^ssss,即若参数setting低16位的值为16,那么相应的缓冲区的大小会被设置为65536字节。参数setting的高16位则用来标明分片(fragment)的最大序号,它的取值范围从2到0x7FFF,其中0x7FFF表示没有任何限制。
int channels = 0; // 0=mono 1=stereo
int result = ioctl(handle, SNDCTL_DSP_STEREO, &channels);
if ( result == -1 ) {
perror("ioctl channel number");
return -1;
}
if (channels != 0) {
// 只支持立体声
}
采样格式和采样频率是在进行音频编程时需要考虑的另一个问题,声卡支持的所有采样格式可以在头文件soundcard.h中找到,而通过ioctl系统调用则可以很方便地更改当前所使用的采样格式。下面的代码示范了如何设置声卡的采样格式。
int format = AFMT_U8;
int result = ioctl(handle, SNDCTL_DSP_SETFMT, &format);
if ( result == -1 ) {
perror("ioctl sample format");
return -1;
}
声卡采样频率的设置也非常容易,只需在调用ioctl时将第二个参数的值设置为SNDCTL_ DSP_SPEED,同时在第三个参数中指定采样频率的数值就行了。对于大多数声卡来说,其支持的采样频率范围一般为5kHz到44.1kHz或者48kHz,但并不意味着该范围内的所有频率都会被硬件支持,在Linux下进行音频编程时最常用到的几种采样频率是11025Hz、16000Hz、22050Hz、32000Hz和44100Hz。下面的代码示范了如何设置声卡的采样频率。
int rate = 22050;
int result = ioctl(handle, SNDCTL_DSP_SPEED, &rate);
if ( result == -1 ) {
perror("ioctl sample format");
return -1;
}
3.2.录音与回放
#include<unistd.h>
#include<fcntl.h>
#include<sys/types.h>
#include<sys/ioctl.h>
#include<linux/soundcard.h>
#include<stdio.h>
#include<stdlib.h>
#include<errno.h> #define DEV "/dev/dsp" /*device name*/
#define RATE 48000 /*sample rate*/
#define SIZE 16 /*data size*/
#define CHANNELS 1 /*channels*/
#define TIME 3 /*times to be recorded*/
#define LENGTH RATE*SIZE*CHANNELS*TIME/8 /*lenght of datas*/
#define ACT_RECORD 0 /*action record*/
#define ACT_PLAY 1 /*action playback*/
#define ACT_RECORD_PLAY 2 /*action record and playback*/ int open_device(const char*, unsigned int);
int close_device(unsigned int);
int set_format(unsigned int, unsigned int, unsigned int, unsigned int); int main()
{
int i;
int fd; /*file descriptor*/
unsigned char* buf; /*buffer for sound datas*/
buf = malloc(LENGTH); printf("open......\n");
/*open the sound device*/
fd = open_device(DEV,ACT_RECORD_PLAY);
if(fd == -1){
fprintf(stderr,"Open Audio Device %s failed:%s\n",DEV,strerror(errno));
return -1;
}
printf("open successed\n"); printf("set......\n"); /*set the format of device*/
if(set_format(fd, SIZE, CHANNELS, RATE) < 0){
fprintf(stderr,"Cann't set %s in bit %d, channel %d, sample rate %d\n",DEV,SIZE,CHANNELS,RATE);
return -1;
}
printf("set successed\n"); /*write data to device*/
for(i = 0; i < 10; i++){
printf("Say...\n");
if(read(fd, buf, LENGTH) < 0){
fprintf(stderr,"Read sound failed:%s\n",strerror(errno));
printf("read\n");
return -1;
}
printf("Listen...\n");
if(write(fd, buf, LENGTH) < 0){
fprintf(stderr,"Write sound failed:%s\n",strerror(errno));
printf("write\n");
return -1;
} if(ioctl(fd, SOUND_PCM_SYNC, 0) < 0){
fprintf(stderr,"Sound sync failed:%s\n",strerror(errno));
printf("sync\n");
return -1;
}
} /*delete the ram and close the file*/
free(buf);
if(close_device(fd) < 0){
fprintf(stderr,"Cann't close device %s:%s\n",DEV,strerror(errno));
return -1;
}
return 0;
} /**********************************************
* open_device():open sound device
***** params: *****
* dev_name --> device name, such as '/dev/dsp'
* flag --> distinguish the action of open device(ACT_RECORD or ACT_PLAY)
***** return: *****
* fild descriptor of sound device if success, -1 if failed
***********************************************/
int open_device(const char* dev_name, unsigned int flag){
int dev_fd;
/*open device*/
if(flag == ACT_RECORD){
if((dev_fd = open(dev_name, O_RDONLY)) < 0){
return -1;
}
} else if(flag == ACT_PLAY){
if((dev_fd = open(dev_name, O_WRONLY)) < 0){
return -1;
}
} else if(flag == ACT_RECORD_PLAY){
if((dev_fd = open(dev_name, O_RDWR)) < 0){
return -1;
}
}
return dev_fd;
} /**********************************************
* close_device():close sound device
***** params: *****
* dev_fd --> the sound device's file descriptor
***** return: *****
* 0 if success, -1 if failed
***********************************************/
int close_device(unsigned int dev_fd){
return (close(dev_fd));
} /**********************************************
* set_format():set record and playback format
***** params: *****
* fd --> device file descriptor
* chn --> channel(MONO or STEREO)
* bits --> data size(8bits or 16bits)
* sr --> sample rate(8KHz or 16KHz or ....)
***** return: *****
* 0 if success, -1 if failed
***** notes: *****
* parameter setting order should be like as below:
* 1. data size(number of bits)
* 2. number of channel(mono or stereo)
* 3. sample rate
***********************************************/
int set_format(unsigned int fd, unsigned int bits, unsigned int chn, unsigned int sr){
int ioctl_val;
/*set data size*/
ioctl_val = bits;
if(ioctl(fd, SOUND_PCM_WRITE_BITS, &ioctl_val) == -1){
fprintf(stderr,"Set SOUND_PCM_WRITE_BITS %d bits failed:%s\n",bits,strerror(errno));
return -1;
}
if(ioctl_val != bits){
fprintf(stderr,"Don't support %d bits,supported %d\n",bits,ioctl_val);
return -1;
} /*set number of channel*/
ioctl_val = chn;
if(ioctl(fd, SOUND_PCM_WRITE_CHANNELS, &ioctl_val) == -1){
fprintf(stderr,"Set SOUND_PCM_WRITE_CHANNELS %d failed:%s\n",chn,strerror(errno));
return -1;
}
if(ioctl_val != chn){
fprintf(stderr,"Don't support %d channel,supported %d\n",chn,ioctl_val);
return -1;
} /*set sample rate*/
ioctl_val = sr;
if(ioctl(fd, SOUND_PCM_WRITE_RATE, &ioctl_val) == -1){
fprintf(stderr,"Set SOUND_PCM_WRITE_RATE %d failed:%s\n",sr,strerror(errno));
return -1;
}
if(ioctl_val != sr){
fprintf(stderr,"Don't support %d sample rate,supported %d\n",sr,ioctl_val);
return -1;
} return 0;
}
关闭/dev/dsp设备可以通过命令:fuser -k /dev/dsp
Tiny6410声卡驱动——录音与回放的更多相关文章
- linux下的声卡驱动架构
1.linux下的声卡驱动架构主要分为OSS架构和ALSA架构. 2.OSS架构 OSS全称是Open Sound System,叫做开放式音频系统,这种早期的音频系统这种基于文件系统的访问方式,这意 ...
- 31.Linux-wm9876声卡驱动(移植+测试)
本节学习目的 1)分析Linux中的OSS声卡系统 2)移植wm9876声卡 3)使用madplay应用程序播放mp3 1.声音三要素 采样频率 音频采样率是指录音设备在一秒钟内对声音信号的采样次数, ...
- AM335x(TQ335x)学习笔记——WM8960声卡驱动移植
经过一段时间的调试,终于调好了TQ335x的声卡驱动.TQ335x采用的Codec是WM8960,本文来总结下WM8960驱动在AM335x平台上的移植方法.Linux声卡驱动架构有OSS和ALSA两 ...
- 十七、S3C2440 音频解码芯片WM8976声卡驱动移植、madplay测试
学习目标:1. WM9876接口和工作原理:2. WM9876驱动移植:3. WM9876应用测试:4. 问题总结 1. WM9876接口和工作原理 本节使用了JZ2440开发板移植WM9876驱动 ...
- Linux ALSA声卡驱动之一:ALS…
声明:本博内容均由http://blog.csdn.net/droidphone原创,转载请注明出处,谢谢! 一. 概述 ALSA是Advanced Linux Sound Architecture ...
- Linux声卡驱动移植和測试
一.分析驱动程序,依据开发板改动代码 代码太长,就不贴了,几个注意点: 1. 查看开发板原理图和S3C2410的datasheet,UDA1341的L3MODE.L3DATA.L3CLOCK分别与S3 ...
- ALSA声卡驱动中的DAPM详解之七:dapm事件机制(dapm event)
前面的六篇文章,我们已经讨论了dapm关于动态电源管理的有关知识,包括widget的创建和初始化,widget之间的连接以及widget的上下电顺序等等.本章我们准备讨论dapm框架中的另一个机制:事 ...
- ALSA声卡驱动中的DAPM详解之四:在驱动程序中初始化并注册widget和route
前几篇文章我们从dapm的数据结构入手,了解了代表音频控件的widget,代表连接路径的route以及用于连接两个widget的path.之前都是一些概念的讲解以及对数据结构中各个字段的说明,从本章开 ...
- Linux ALSA声卡驱动之八:ASoC架构中的Platform
1. Platform驱动在ASoC中的作用 前面几章内容已经说过,ASoC被分为Machine,Platform和Codec三大部件,Platform驱动的主要作用是完成音频数据的管理,最终通过C ...
随机推荐
- UVA 350 Pseudo-Random Numbers 伪随机数(简单)
题意:给定Z, I, M, L,根据随机数产生式k=(Z*L+I)%M.但是L表示的是上一个产生的数,比如根据产生式产生了序列{2,5,4,3}那么5是由L=2算来的,4由L=5算来的..第1个所产 ...
- liunx环境下的mysql数据库配置文件my.conf内的参数含义
[client]port = 3306socket = /tmp/mysql.sock [mysqld]port = 3306socket = /tmp/mysql.sock basedir = /u ...
- Oracle alter index rebuild 与 ORA-08104 说明
在ITPUB 论坛上看到的一个帖子,很不错.根据论坛的帖子重做整理了一下. 原文链接如下: alter index rebuild online引发的血案 http://www.itpub.net/t ...
- Ejabberd源码解析前奏--概述
一.绪论 Ejabberd是一个用Erlang/OTP写的开源即时通讯服务器,其是跨平台.分布式.容错且基于开放标准的实时通讯系统.Ejabberd是一个功能丰富的XMPP服务器,同时适合小规模 ...
- mysql 自旋锁
自旋(spin)是一种通过不间断地测试来查看一个资源是否变为可用状态的等待操作,用于仅需要等待很短的时间等待所需资源的场景.使用自旋这种“空闲循环(busy-loop)”来完成资源等待的方式要比通过上 ...
- 音频PCM格式
经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等. 44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 ...
- bzoj 3207 花神的嘲讽计划Ⅰ(哈希法+主席树)
[题目链接] http://www.lydsy.com/JudgeOnline/problem.php?id=3207 [题意] 给定一个文本串,多次询问K长的模式串是否在文本[l,r]区间内出现. ...
- 树形DP+树状数组 HDU 5877 Weak Pair
//树形DP+树状数组 HDU 5877 Weak Pair // 思路:用树状数组每次加k/a[i],每个节点ans+=Sum(a[i]) 表示每次加大于等于a[i]的值 // 这道题要离散化 #i ...
- 【转】VC6.0附带小工具软件一览
)ActiveX Control Test Container称为"ActiveX 控件测试容器",顾名思义,此工具的主要功能就是测试ActiveX 控件,可以通过改变Active ...
- 《Genesis-3D开源游戏引擎完整实例教程-2D射击游戏篇01:播放序列动画》
1.播放序列动画 系列动画播放概述 2D游戏中的动画系统,不同于3D游戏.3D游戏中,角色美术资源不仅包含角色模型的,还包括角色的贴图和动作等,模型本身自带角色的动作动画效果.2D游戏中,角色美术资源 ...