Linux音频编程（二）声卡介绍

一、声卡

1、声卡是audio interface，它含有hardware buffer，而这个hardware buffer是在声卡里面，不是内存。声卡的缓存是环状的，则ALSA中是将数据分成连续的片段然后传到按单元片段传输。

2、当我们通过麦克风讲话的声音搜集到声卡里之后，将内存从声卡设备文件中读取声音数据的过程就是录音过程；把内存中的声音数据写入到声卡的设备文件中可以实现音频文件。

3、我们在/dev/snd/目录下用ls命令就可以看到相关的声卡设备。

4、模/数(ADC)转换器将模拟电压转换成离散的样本值。声音以固定的时间间隔被采样，采样的速率称为采样率。把样本输出到数/模(DAC)转换器，比如扩音器，最后转换成原来的模拟信号。

二、相关设备文件介绍

1、/dev/dsp

用于数字采样（sampling）和数字录音（recording）的设备文件，向该设备写数据时使用声卡上的D/A转换器进行放音，而向该设备读数据时使用声卡上的A/D转换器进行录音。

声卡使用DSP（数字信号处理器）来实现模拟信号和数字信号之间的转换（有D/A和A/D转换）。声卡中的DSP设备在以只读方式打开/dev/dsp时，使用A/D转换器变成数字采样后的样本，通过read系统调用从声卡读取数据进行声音的输入；以只写方式打开/dev/dsp时，数字信号经过D/A转换器变成模拟信号，通过write进行声音的输出。以读写的方式打开 /dev/dsp可同时进行声音的输入和输出。

2、/dev/sequencer合成器

3、/dev/mixer混音器

三、使用

1、在打开声卡之后可通过ioctl函数来设置声卡参数，函数如下所示：

int ioctl(int fd, int request, ...);

//参数fd是打开的文件的描述符，它是在设备打开时获得的；如果设备比较复杂，那么对它的控制请求相应地也会有很多种。

//参数request是命令，它的目的就是用来区分不同的控制请求；通常说来，在对设备进行控制时还需要有其它参数，这要根据不同的控制请求才能确定，并且可能是与硬件设备直接相关的。

//第三个参数是完成命令的操作需要的参数或返回的结果。它的意义取决于命令参数，可以是单个数，或是指向复杂的数据结构的指针。（由于ioctl函数面向所有设备文件，不同的设备又是千差万别，所以，第三个参数的意义、函数的返回值、错误代码等等都取决于command。并且，不同的设备，即使是相同的command也有不同的含义，需要的参数和返回值、错误代码等也不同。）

//ioctl函数中相关的命令如下：

SOUND_PCM_WRITE_BITS：设置声卡的量化位数，8或者16，有些声卡不支持16位；

SOUND_PCM_READ_BITS：获取当前声卡的量化位数；

SOUND_PCM_WRITE_CHANNELS：设置声卡的声道数目，1或者2，1为单声道，2为立体声；

SOUND_PCM_READ_CHANNELS：获取当前声卡的声道数；

SOUND_PCM_WRITE_RATE：设置声卡的采样频率，8K，16K等等；

SOUND_PCM_READ_RATE：获取声卡的采样频率

（1）声卡读取数据和向声卡写入数据时，具有特定的格式，默认为8位无符号数据、单声道、8KHz采样率，可通过ioctl系统调用来改变格式，可调节运行在Linux内核中的声卡驱动程序中缓冲区的大小，进而达到放音和录音想要的效果。例如：

//缓冲区大小设置

int setting = 0xnnnnssss;
int result = ioctl(handle, SNDCTL_DSP_SETFRAGMENT, &setting);

//参数setting实际上由两部分组成，其低16位标明缓冲区的尺寸，相应的计算公式为buffer_size = 2^ssss；

//若参数setting低16位的值为16，那么相应的缓冲区的大小会被设置为65536字节。参数setting的高16位则用来标明分片（fragment）的最大序号，它的取值范围从2一直到0x7FFF，其中0x7FFF表示没有任何限制。

//设置声卡声道数目

int channels = 0; //0=mono 1=stereo

int result = ioctl(handle, SNDCTL_DSP_STEREO, &channels);

//设置采样格式

int format = AFMT_U8;

int result = ioctl(handle, SNDCTL_DSP_SETFMT, &format);

//设置采样频率

int rate = 22050;
int result = ioctl(handle, SNDCTL_DSP_SPEED, &rate);

//调用ioctl时将第二个参数的值设置为SNDCTL_DSP_SPEED，同时在第三个参数中指定采样频率的数值。

//在 Linux下进行音频编程时最常用到的几种采样频率是11025Hz、16000Hz、22050Hz、32000Hz和44100Hz。

2、直接使用系统调用控制声卡的是tinyalsa库，位于目录/external/tinyalsa下，编译生成库文件libtinyalsa.so（只涉及两个文件mixer.c,pcm.c），编译生成工具 tinycap，tinymix，tinypcminfo，tinyplay，可用于直接控制音频通道，进行录音播音测试。tinyalsa中使用：
pcm_open()来打开声卡；
pcm_write()来播放音乐；
pcm_read()来录音。

3、config 的配置很重要，tinyalsa直接从wav文件把channels,rate,等读出来并配置进声卡。

//转换成config

config.channels = channels; //声道数目

config.rate = rate; //采样频率

config.period_size = 1024; //周期

config.period_count = 4; //count

if (bits == 32)

config.format = PCM_FORMAT_S32_LE; //

else if (bits == 16)

config.format = PCM_FORMAT_S16_LE;

config.start_threshold = 0;

config.stop_threshold = 0;

config.silence_threshold = 0;

pcm = pcm_open(card, device, PCM_IN, &config);

if (!pcm || !pcm_is_ready(pcm)) {

printf("Unable to open PCM device (%s)\n",pcm_get_error(pcm));

return 0;

}

四、

1、spdif接口支持rawdata和pcmdata模式。

当音频channel设置成channels=4的时候，spdif会相应设置成rawdata模式。当音频channel设置成channels=2或者1的时候，spdif会设置成pcmdata模式。spdif是一个独立的音频驱动，接口支持alsalib中的标准接口。

2、Hdmiaudio支持rawdata和pcmdata模式。

当音频channel设置成channels=4的时候，hdmiaudio会相应设置成rawdata模式。当音频channel设置成channels=2或者1的时候，hdmiaudio会设置成pcmdata模式。Hdmiaudio是一个独立的音频驱动，接口支持alsalib中的标准接口。

Linux音频编程（二）声卡介绍的更多相关文章

Linux音频编程指南
Linux音频编程指南虽然目前Linux的优势主要体现在网络服务方面,但事实上同样也有着非常丰富的媒体功能,本文就是以多媒体应用中最基本的声音为对象,介绍如何在Linux平台下开发实际的音频应用程序 ...
Linux音频编程指南(转)
转自: http://www.ibm.com/developerworks/cn/linux/l-audio/ Linux音频编程指南虽然目前Linux的优势主要体现在网络服务方面,但事实上同样也有 ...
Linux音频编程
1. 背景在<Jasper语音助理介绍>中, 介绍了Linux音频系统, 本文主要介绍了Linux下音频编程相关内容. 音频编程主要包括播放(Playback)和录制(Record), ...
[转] - Linux网络编程 -- 网络知识介绍
(一)Linux网络编程--网络知识介绍 Linux网络编程--网络知识介绍客户端和服务端网络程序和普通的程序有一个最大的区别是网络程序是由两个部分组成的--客户端和服务器端. 客户 ...
Linux网络编程(二)
Linux网络编程(二) 使用多进程实现服务器并发访问. 采用多进程的方式实现服务器的并发访问的经典范例. 程序实现功能: 1.客户端从标准输入读入一行文字,发送到服务器. 2.服务器接收到客户端发来 ...
Linux音频编程（一）ALSA介绍
Linux下的音频编程中有OSS和ALSA,本篇文章将对ALSA进行相关介绍.ALSA提供一系列基于命令行的工具集,比如混音器(mixer),音频文件播放器(aplay),以及控制特定声卡特定属性的工 ...
【Linux系统编程应用】Linux音频编程基础（一）【转】
转自:https://blog.csdn.net/dengjin20104042056/article/details/52435290 一.数字音频音频信号是一种连续变化的模拟信号,但计算机只能处 ...
Linux音频编程（三）混音器介绍
一.介绍 1.mixer:用来控制多个输入.输出的音量,也控制输入(microphone,line-in,CD)之间的切换,可以将多个信号组合或者叠加在一起.声卡上的混音器由多个混音通道组成,它们可以 ...
linux 音频编程
http://blog.csdn.net/sea918/article/details/7249216 1.音频开发模型: OSS(open sound system) linux/unix 平 ...

随机推荐

Python 之父再发文：构建一个 PEG 解析器
花下猫语: Python 之父在 Medium 上开了博客,现在写了两篇文章,本文是第二篇的译文.前一篇的译文在此 ,宣布了将要用 PEG 解析器来替换当前的 pgen 解析器. 本文主要介绍了构建 ...
自练Eclipse搭建SSH全自动注解博客项目笔记
1.创建一个动态的java项目 2.导入搭建所需要的jar包 3.配置web.xml文件 1).头文件 2).struts2的拦截器 3).定位加载Spring容器的配置文件 4).监听 5). 6) ...
oracle 创建表空间，用户并授权
1. 查看所有表空间及存储路径 select file_name, tablespace_name from dba_data_files; 2. 创建表空间 CREATE TABLESPACE xs ...
JavaWeb——Servlet开发1
Java Servlet是运行在服务器端上的程序,Servlet是Java Servlet包中的一个接口,能够直接处理和相应客户端的请求,也可以将工作委托给应用的其他类. public interfa ...
百度Echarts，蚂蚁金服G2，D3三种主流可视化工具对比
1.百度的Echarts 官网:https://echarts.baidu.com/ 介绍:ECharts,缩写来自Enterprise Charts,是百度推出的一款开源的,商业级数据图表,它最初是 ...
luoguP2444_[POI2000]病毒
题意给定多个01模式串,问是否存在一个无限长的字符串不包含任何一个模式串. 分析好像数据有点水,网上一大堆题解连样例都没过??? 多模式串,先把AC自动机建出来再说. 反向考虑,若存在一个无限长的 ...
Linux网络问题排错
前言作为一名软件工程师,Linux相关的知识是一个不可或缺的技能点,而网络问题往往是初学者接触Linux时最先碰到的一只拦路虎,本篇博客将系统的讲解一个解决Linux网络问题的通用方法论,一个科学的 ...
hbase性能优化，看这篇就够了
HDFS(hdfs-site.xml)相关调整 dfs.datanode.synconclose = true dfs.datanode.synconclose set to false in hdf ...
原生js实现的一个随机颜色的简单效果
<!DOCTYPE html> <html> <head> <meta charset="utf-8" /> <meta na ...
HDU 6363
题意略. 思路: 这里有两个结论需要注意: 1.gcd(a ^ x - 1,a ^ y - 1) = a ^ gcd(x,y) - 1 2.gcd(fib[x],fib[y]) = fib[gcd(x ...

Linux音频编程（二）声卡介绍

Linux音频编程（二）声卡介绍的更多相关文章

随机推荐

热门专题