Linux对于录音
一、原理简介
在Linux下,记录——从dsp读取数据。播放——至dsp设备写入数据。
开发板採用声卡UDA1341实现音频编解码,完毕A/D和D/A转换,芯片UDA1341与CPU的连接图例如以下:
为了实现全双工,传输数据须要使用两个DMA通道。以音频回放为例,传输数据先由内部总线送到内存。 然后传到DMA控制器通道1,再通过IIS控制器写入IIS总线并传输给音频芯片,通道2用来录音。
二、WAV文件
WAVE是录音时用的标准的Windows文件格式,文件的扩展名为“wav”。数据本身的格式为PCM或压缩型。属于无损音乐格式的一种,符合RIFF(Resource Interchange File Format)规范。全部的WAV都有一个文件头,这个文件头音频流的编码參数。
数据块的记录方式是小端(little-endian)字节顺序,标志符并非字符串而是单独的符号
以採样率为8kHz,量化位数为16,单通道的record.wav文件为例,文件前三行信息例如以下:
第一列表示地址,一行表示16个字节。
0x52,0x49,0x46,0x46 //“RIFF”4个字符相应的ASCII码值
0x57,0x41,0x56,0x45,0x66,0x6D,0x74,0x20 //“WAVEfmt ”各个字符相应的ASCII码值
0x10,0x00,0x00,0x00,0x01,0x00,0x01,0x00//sizeof(PCMWAVEFORMAT)4Byte,格式类别2B,通道数1B(声道)
0x40,0x1F,0x00,0x00,0x80,0x3E,0x00,0x00, //採样频率0X0001F40= 8kHZ(8000Hz)4B。0x00003E80B/s=16kB/s 4B
0x02,0x00,0x10,0x00,0x64,0x61,0x74,0x61};//数据调整数0x0002(1*16/8)2B,即一个採样点所占的字节数。样本数据位数0x10(16位)2B,即一个採样点所表示的位数 “data”4B
地址000014H~000017H的值:2400 01 00即十六进制0x00010024,相应十进制65572(65536+36),表示从0x08開始到文件尾的总字节数;
地址000028H~00002BH的值:0080 0C 00即十六进制0x00010000,相应十进制65536,表示採样数据总数。
录音測试命令:cat /dev/sound/dsp > audio.wav
使用cat命令生成的audio.wav是一个PCM纯音频文件:
通过加入wav文件头,能够生成一个标准的wav音频文件:
三、Linux下实现录放音
注意驱动程序中的默认參数,应用程序能够通过ioctl()函数设置新的取值。
Open()函数:採用何种模式对声卡进行操作也必须在打开设备时指定,对于不支持全双工的声卡来说,应该使用仅仅读或者仅仅写的方式打开。仅仅有那些支持全双工的声卡。才干以读写的方式打开,这还依赖于驱动程序的详细实现。open_mode有三种选择:O_RDONLY。O_WRONLY和O_RDWR,分别表示仅仅读、仅仅写和读写。
OSS建议尽量使用仅仅读或仅仅写。仅仅有在全双工的情况下(即录音和放音同一时候)才使用读写模式。Linux
同意应用程序多次打开或者关闭与声卡相应的设备文件,从而可以非常方便地在放音状态和录音状态之间进行切换。
注意,用户始终要读/写一个完整的採样。比如一个16-bit的立体声模式下。每一个採样有4个字节。所以应用程序每次必须读/写4的倍数个字节。
源代码例如以下:
#include<unistd.h>
#include<fcntl.h>
#include<sys/types.h>
#include<sys/ioctl.h>
#include<stdlib.h>
#include<stdio.h>
#include<linux/soundcard.h> #define LENGTH 3 // 存储秒数
#define RATE 44100 // 採样频率
#define SIZE 16 // 量化位数
#define CHANNELS 2 // 声道数目
/* 用于保存数字音频数据的内存缓冲区*/
unsigned charbuf[LENGTH*RATE*SIZE*CHANNELS/8];
int main()
{
intfd; // 声音设备的文件描写叙述符
intarg; // 用于ioctl调用的參数
intstatus; // 系统调用的返回值
/*打开声音设备 */
fd= open("/dev/sound/dsp", O_RDONLY);
if(fd< 0)
{
perror("openof /dev/sound/dsp failed");
exit(1);
} /*设置採样时的量化位数 */
arg= SIZE;
status= ioctl(fd, SOUND_PCM_WRITE_BITS, &arg);
if(status== -1)
perror("SOUND_PCM_WRITE_BITSioctl failed");
if(arg!= SIZE)
perror("unableto set sample size");
/*设置採样时的声道数目 */
arg= CHANNELS;
status= ioctl(fd, SNDCTL_DSP_STEREO, &arg);
if(status== -1)
perror("SNDCTL_DSP_STEREOioctl failed");
if(arg!= CHANNELS)
perror("unableto set number of channels");
/*设置採样时的採样频率 */
arg= RATE;
status= ioctl(fd, SNDCTL_DSP_SPEED, &arg);
if(status== -1)
perror("SNDCTL_DSP_SPEEDioctl failed");
if(arg!= RATE)
perror("unableto set rate"); printf("Saysomething:\n");
status= read(fd, buf, sizeof(buf)); //recording
if(status!= sizeof(buf))
perror("readwrong number of bytes");
printf("Yousaid:\n");
close(fd);
fd= open("/dev/sound/dsp", O_WRONLY);
if(fd< 0)
{
perror("openof /dev/sound/dsp failed");
exit(1);
} /*设置採样时的量化位数 */
arg= SIZE;
status= ioctl(fd, SOUND_PCM_WRITE_BITS, &arg);
if(status == -1)
perror("SOUND_PCM_WRITE_BITS ioctl failed");
if(arg != SIZE)
perror("unable toset sample size");
/*设置採样时的声道数目 */
arg = CHANNELS;
status = ioctl(fd, SNDCTL_DSP_STEREO,&arg);
if(status == -1)
perror("SNDCTL_DSP_STEREO ioctl failed");
if(arg != CHANNELS)
perror("unable toset number of channels");
/* 设置採样时的採样频率 */
arg = RATE;
status = ioctl(fd,SNDCTL_DSP_SPEED, &arg);
if(status == -1)
perror("SNDCTL_DSP_SPEED ioctl failed");
if(arg != RATE)
perror("unable toset rate"); status= write(fd, buf, sizeof(buf)); //playing
if(status!= sizeof(buf))
perror("wrotewrong number of bytes");
close(fd);
return0;
}
程序中的注意点是open()函数的參数设置,之前採用參数O_RDWR,结果放音时总是出现错误。详细出错原因可能与驱动程序的设置有关。本设计中。正确的设置是当recording时,选择O_RDONLY,什么时候playing时间。选择O_WRONLY。
Linux对于录音的更多相关文章
- linux声卡录音和播放(alsa方法)
前言 客户购买多台UNO-2184,使用fedora23系统进行视频监控,视频监控的同时,也要同步采集现场画面的声音,原来系统采用的是fedora 14,之前是通过操作/dev/bsp,对声卡进行操作 ...
- Linux 应用笔记
Linux 应用笔记 Linux 应用笔记 小书匠 Raspberry Pi 常用命令 CentOs Raspberry Ubuntu python 实用教程 Vim 权限问题 内存分配 shell ...
- 转载-好用的linux软件合集
音频 Airtime – Airtime 是一款用于调度和远程站点管理的开放广播软件 Ardour – 在 Linux 上录音,编辑,和混音 Audacious – 开源音频播放器,按你想要的方式 ...
- Linux 软件大全
应用 音频 Airtime - Airtime 是一款用于调度和远程站点管理的开放广播软件 Ardour - 在 Linux 上录音,编辑,和混音 Audacious - 开源音频播放器,按你想 ...
- 海量的超赞 Linux 软件 (转载)
海量的超赞 Linux 软件 作者: VoLuong 译者: LCTT Mo | 2016-08-24 16:01 评论: 27 收藏: 38 这个仓库收集了对任何用户/开发者都超赞的 Linux ...
- 超赞的Linux软件分享(持续更新)
开发 Android studio - Android 的官方 IDE:Android Studio 提供在各种类型的安卓设备上构建应用最快的工具. Aptana - Aptana Studio 利用 ...
- Linux 驱动开发
linux驱动开发总结(一) 基础性总结 1, linux驱动一般分为3大类: * 字符设备 * 块设备 * 网络设备 2, 开发环境构建: * 交叉工具链构建 * NFS和tftp服务器安装 3, ...
- 微信录音文件上传到服务器以及amr转化成MP3格式,linux上转换简单方法
微信公众号音频接口开发 根据业务需求,我们可能需要将微信录音保存到服务器,而通过微信上传语音接口上传到微信服务器的语音文件的有效期只有3天,所以需要将文件下载到我们自己的服务器. 上传语音接口 wx. ...
- 〖Linux〗录像桌面视频同时录音
1. 安装依赖的包 sudo apt-get install -y ffmpeg oss-compat alsa-oss 2. 录制桌面视频并录音 aoss ffmpeg -f oss -i /dev ...
随机推荐
- 0x00000000该内存不能为read
0X000000存储器不能read解决方案 有这种现象方面,首先,在硬件,这有问题的内存,二,软件,其中有许多问题. 一:先说说硬件: 一般来说,电脑硬件不easy生病.内存故障的可能性并不大(非你的 ...
- facade pattern
外观模式是一种使用频率非常高的设计模式,它通过引入一个外观角色来简化客户端与子系统之间的交互,为复杂的子系统调用提供一个统一的入口,使子系统与客户端的耦合度降低,且客户端调用非常方便.外观模式并不给系 ...
- BAE3.0搭建wordpress注意
仅仅是mark一个注意的点,数据库连接时,主机是: /** MySQL主机 */ define('DB_HOST', 'sqld.duapp.com:4050');
- 80x86汇编小站站长简单介绍-2014年08月23日
[序言] 旧版的"80x86汇编小站站长简单介绍"已经过时了, 因此于2013年10月01日花费1个小时又一次更新和排版一次. [人生格言] 1] 一生都用头脑而不是情绪解决这个 ...
- checkbox的attr("checked")一直以来,undefined问题解决
最近,屌丝要项目开发的需要,需要一个完整的选checkbox特征. 该死的~~这不是很easy什么东西,共checkbox,N多个子的checkbox,总checkbox一旦选定,儿checkbox所 ...
- BP神经网络的基本原理
2.1 BP神经网络基本原理 BP网络模型处理信息的基本原理是:输入信号Xi通过中间节点(隐层点)作用于输出节点.经过非线形变换,产生输出信号Yk,网络训练的每一个样本包含输入向量X和期望输出量t,网 ...
- Java NIO框架Netty课程(一) – Hello Netty
首先啰嗦2,假如你不知道Netty怎么办怎么办.它可以是一个简单的搜索,找出.我只能说Netty是NIO该框架,它可用于开发分布式Java计划.详细情况可以做,我们可以尝试用你的想象力. 技术,它是服 ...
- CF417D--- Cunning Gena(序列+像缩进dp)
A boy named Gena really wants to get to the "Russian Code Cup" finals, or at least get a t ...
- 返璞归真 asp.net mvc (6) - asp.net mvc 2.0 新特性
原文:返璞归真 asp.net mvc (6) - asp.net mvc 2.0 新特性 [索引页][源码下载] 返璞归真 asp.net mvc (6) - asp.net mvc 2.0 新特性 ...
- Linux常见命令整理(一)
整理一下,以备后用 cd /home 进入/home文件夹 cd .. 返回上一级文件夹 cd ../.. 返回上两级文件夹 cd 进入个人的主文件夹 cd - 返回上次所在的文件夹 pwd 显 ...