一、AudioTrack 基本使用

AudioTrack 类可以完成Android平台上音频数据的输出任务。AudioTrack有两种数据加载模式（MODE_STREAM和MODE_STATIC），对应的是数据加载模式和音频流类型，对应着两种完全不同的使用场景。

MODE_STREAM：在这种模式下，通过write一次次把音频数据写到AudioTrack中。这和平时通过write系统调用往文件中写数据类似，但这种工作方式每次都需要把数据从用户提供的Buffer中拷贝到AudioTrack内部的Buffer中，这在一定程度上会使引入延时。为解决这一问题，AudioTrack就引入了第二种模式。
MODE_STATIC：这种模式下，在play之前只需要把所有数据通过一次write调用传递到AudioTrack中的内部缓冲区，后续就不必再传递数据了。这种模式适用于像铃声这种内存占用量较小，延时要求较高的文件。但它也有一个缺点，就是一次write的数据不能太多，否则系统无法分配足够的内存来存储全部数据。

1.1 MODE_STATIC模式

MODE_STATIC模式输出音频的方式如下（注意：如果采用STATIC模式，须先调用write写数据，然后再调用play。）：

public class AudioTrackPlayerDemoActivity extends Activity implements

        OnClickListener {

    private static final String TAG = "AudioTrackPlayerDemoActivity";

    private Button button;

    private byte[] audioData;

    private AudioTrack audioTrack;

    @Override

    public void onCreate(Bundle savedInstanceState) {

        super.onCreate(savedInstanceState);

        super.setContentView(R.layout.main);

        this.button = (Button) super.findViewById(R.id.play);

        this.button.setOnClickListener(this);

        this.button.setEnabled(false);

        new AsyncTask<Void, Void, Void>() {

            @Override

            protected Void doInBackground(Void... params) {

                try {

                    InputStream in = getResources().openRawResource(R.raw.ding);

                    try {

                        ByteArrayOutputStream out = new ByteArrayOutputStream(

                                264848);

                        for (int b; (b = in.read()) != -1;) {

                            out.write(b);

                        }

                        Log.d(TAG, "Got the data");

                        audioData = out.toByteArray();

                    } finally {

                        in.close();

                    }

                } catch (IOException e) {

                    Log.wtf(TAG, "Failed to read", e);

                }

                return null;

            }

            @Override

            protected void onPostExecute(Void v) {

                Log.d(TAG, "Creating track...");

                button.setEnabled(true);

                Log.d(TAG, "Enabled button");

            }

        }.execute();

    }

    public void onClick(View view) {

        this.button.setEnabled(false);

        this.releaseAudioTrack();

        this.audioTrack = new AudioTrack(AudioManager.STREAM_MUSIC, 44100,

                AudioFormat.CHANNEL_OUT_STEREO, AudioFormat.ENCODING_PCM_16BIT,

                audioData.length, AudioTrack.MODE_STATIC);

        Log.d(TAG, "Writing audio data...");

        this.audioTrack.write(audioData, 0, audioData.length);

        Log.d(TAG, "Starting playback");

        audioTrack.play();

        Log.d(TAG, "Playing");

        this.button.setEnabled(true);

    }

    private void releaseAudioTrack() {

        if (this.audioTrack != null) {

            Log.d(TAG, "Stopping");

            audioTrack.stop();

            Log.d(TAG, "Releasing");

            audioTrack.release();

            Log.d(TAG, "Nulling");

        }

    }

    public void onPause() {

        super.onPause();

        this.releaseAudioTrack();

    }

}

1.2 MODE_STREAM模式

MODE_STREAM 模式输出音频的方式如下：

byte[] tempBuffer = new byte[bufferSize];

int readCount = ;

while (dis.available() > ) {

    readCount = dis.read(tempBuffer);

    if (readCount == AudioTrack.ERROR_INVALID_OPERATION || readCount == AudioTrack.ERROR_BAD_VALUE) {

        continue;

    }

    if (readCount !=  && readCount != -) {

        audioTrack.play();

        audioTrack.write(tempBuffer, , readCount);

    }

}

二、AudioTrack 详解

2.1 音频流的类型

在AudioTrack构造函数中，会接触到AudioManager.STREAM_MUSIC这个参数。它的含义与Android系统对音频流的管理和分类有关。

Android将系统的声音分为好几种流类型，下面是几个常见的：

· STREAM_ALARM：警告声

· STREAM_MUSIC：音乐声，例如music等

· STREAM_RING：铃声

· STREAM_SYSTEM：系统声音，例如低电提示音，锁屏音等

· STREAM_VOCIE_CALL：通话声

注意：上面这些类型的划分和音频数据本身并没有关系。例如MUSIC和RING类型都可以是某首MP3歌曲。另外，声音流类型的选择没有固定的标准，例如，铃声预览中的铃声可以设置为MUSIC类型。音频流类型的划分和Audio系统对音频的管理策略有关。

2.2 Buffer分配和Frame的概念

在计算Buffer分配的大小的时候，我们经常用到的一个方法就是：getMinBufferSize。这个函数决定了应用层分配多大的数据Buffer。

AudioTrack.getMinBufferSize(8000,//每秒8K个采样点

　　      AudioFormat.CHANNEL_CONFIGURATION_STEREO,//双声道

        AudioFormat.ENCODING_PCM_16BIT);

从AudioTrack.getMinBufferSize开始追溯代码，可以发现在底层的代码中有一个很重要的概念：Frame（帧）。Frame是一个单位，用来描述数据量的多少。1单位的Frame等于1个采样点的字节数×声道数（比如PCM16，双声道的1个Frame等于2×2=4字节）。1个采样点只针对一个声道，而实际上可能会有一或多个声道。由于不能用一个独立的单位来表示全部声道一次采样的数据量，也就引出了Frame的概念。Frame的大小，就是一个采样点的字节数×声道数。另外，在目前的声卡驱动程序中，其内部缓冲区也是采用Frame作为单位来分配和管理的。

下面是追溯到的native层的方法：

 // minBufCount表示缓冲区的最少个数，它以Frame作为单位

   uint32_t minBufCount = afLatency / (( *afFrameCount)/afSamplingRate);

    if(minBufCount < ) minBufCount = ;//至少要两个缓冲

   //计算最小帧个数

   uint32_tminFrameCount =

         (afFrameCount*sampleRateInHertz*minBufCount)/afSamplingRate;

  //下面根据最小的FrameCount计算最小的缓冲大小

   intminBuffSize = minFrameCount //计算方法完全符合我们前面关于Frame的介绍

           * (audioFormat == javaAudioTrackFields.PCM16 ?  : )

           * nbChannels;

    returnminBuffSize;

getMinBufSize会综合考虑硬件的情况（诸如是否支持采样率，硬件本身的延迟情况等）后，得出一个最小缓冲区的大小。一般我们分配的缓冲大小会是它的整数倍。

2.3 AudioTrack构造过程

每一个音频流对应着一个AudioTrack类的一个实例，每个AudioTrack会在创建时注册到 AudioFlinger中，由AudioFlinger把所有的AudioTrack进行混合（Mixer），然后输送到AudioHardware中进行播放，目前Android同时最多可以创建32个音频流，也就是说，Mixer最多会同时处理32个AudioTrack的数据流。

三、 AudioTrack 与 MediaPlayer 的对比

播放声音可以用MediaPlayer和AudioTrack，两者都提供了Java API供应用开发者使用。虽然都可以播放声音，但两者还是有很大的区别的。

3.1 区别

其中最大的区别是MediaPlayer可以播放多种格式的声音文件，例如MP3，AAC，WAV，OGG，MIDI等。MediaPlayer会在framework层创建对应的音频解码器。而AudioTrack只能播放已经解码的PCM流，如果对比支持的文件格式的话则是AudioTrack只支持wav格式的音频文件，因为wav格式的音频文件大部分都是PCM流。AudioTrack不创建解码器，所以只能播放不需要解码的wav文件。

3.2 联系

MediaPlayer在framework层还是会创建AudioTrack，把解码后的PCM数流传递给AudioTrack，AudioTrack再传递给AudioFlinger进行混音，然后才传递给硬件播放,所以是MediaPlayer包含了AudioTrack。

3.3 SoundPool

在接触Android音频播放API的时候，发现SoundPool也可以用于播放音频。下面是三者的使用场景：MediaPlayer 更加适合在后台长时间播放本地音乐文件或者在线的流式资源; SoundPool 则适合播放比较短的音频片段，比如游戏声音、按键声、铃声片段等等，它可以同时播放多个音频; 而 AudioTrack 则更接近底层，提供了非常强大的控制能力，支持低延迟播放，适合流媒体和VoIP语音电话等场景。

四、源码

https://github.com/renhui/AudioDemo

Android 音视频开发(三)：使用 AudioTrack 播放PCM音频的更多相关文章

Android 音视频开发（一）：PCM 格式音频的播放与采集
什么是 PCM 格式声音从模拟信号转化为数字信号的技术,经过采样.量化.编码三个过程将模拟信号数字化. 采样顾名思义,对模拟信号采集样本,该过程是从时间上对信号进行数字化,例如每秒采集 44100 ...
Android 音视频开发(二)：使用 AudioRecord 采集音频数据并保存到文件
版权声明:转载请说明出处:http://www.cnblogs.com/renhui/p/7457321.html 一.AudioRecord API详解 AudioRecord是Android系统提 ...
Android 音视频开发(二)：使用 AudioRecord 采集音频PCM并保存到文件
版权声明:转载请说明出处:http://www.cnblogs.com/renhui/p/7457321.html 一.AudioRecord API详解 AudioRecord是Android系统提 ...
Android 音视频深入三 MP4解码播放视频（附源码下载）
本篇项目地址,名字是媒体解码MediaCodec,MediaExtractor,求starhttps://github.com/979451341/Audio-and-video-learning-m ...
Android 音视频开发(一) : 通过三种方式绘制图片
版权声明:转载请说明出处:http://www.cnblogs.com/renhui/p/7456956.html 在 Android 音视频开发学习思路里面,我们写到了,想要逐步入门音视频开发,就 ...
Android 音视频开发学习思路
Android 音视频开发这块目前的确没有比较系统的教程或者书籍,网上的博客文章也都是比较零散的.只能通过一点点的学习和积累把这块的知识串联积累起来. 初级入门篇: Android 音视频开发(一) ...
Android音视频开发（1）：H264 基本原理
前言 H264 视频压缩算法现在无疑是所有视频压缩技术中使用最广泛,最流行的.随着 x264/openh264 以及 ffmpeg 等开源库的推出,大多数使用者无需再对H264的细节做过多的研究,这大 ...
Android 音视频开发(七)：音视频录制流程总结
在前面我们学习和使用了AudioRecord.AudioTrack.Camera.MediaExtractor.MediaMuxer API.MediaCodec. 学习和使用了上述的API之后,相信 ...
Android 音视频开发入门指南
Android 音视频从入门到提高 —— 任务列表 http://blog.51cto.com/ticktick/1956269(以这个学习为基础往下面去学习) Android 音视频开发学习思路-- ...

随机推荐

Widows自带系统监控工具——24小时监控服务器性能
博文来源:https://blog.csdn.net/qq_41650233/article/details/84313153 操作步骤1.运行程序perfmon.exe 2.在数据收集器下选择[用户 ...
vue学习(二)
Snakes 的 Naïve Graph
题解: 首先分析一下这个问题发现等价于是求n之内与n互素的数的个数,即欧拉函数这个可以线性筛但发现还应该减去$x^2==1$的情况这个东西不是那么好处理考虑用中国剩余定理拆因为$p1^{a ...
课堂小记---JavaScript（2）
本阶段难点疑点梳理 1.关于switch中default的使用: default同case功能一样,区别在于并不匹配任何信息,只有当case中无任何匹配的时候才会执行default.需要注意的是,这是 ...
python接口自动化1
组织架构: 包括配置文件,反射.文件路径.Excel操作.测试报告生成 case.config [MODE] file_name=case_data.xlsx mode={"register ...
Kafka消费者组再均衡问题
在Kafka中,当有新消费者加入或者订阅的topic数发生变化时,会触发Rebalance(再均衡:在同一个消费者组当中,分区的所有权从一个消费者转移到另外一个消费者)机制,Rebalance顾名思义 ...
gcd前缀和-蒜头君的数轴
题目: 今天蒜头君拿到了一个数轴,上边有 n个点,但是蒜头君嫌这根数轴不够优美,想要通过加一些点让它变优美,所谓优美是指考虑相邻两个点的距离,最多只有一对点的距离与其它的不同. 蒜头君想知道,他最少需 ...
mysql 分库分表转
分表是分散数据库压力的好方法. 分表,最直白的意思,就是将一个表结构分为多个表,然后,可以再同一个库里,也可以放到不同的库. 当然,首先要知道什么情况下,才需要分表.个人觉得单表记录条数达到百万到千万 ...
python基础知识练习题（二）
1. 有两个列表 l1 = [11, 22, 33] l2 = [22, 33, 44] a.获取内容相同的元素列表 li = []l1 = [11, 22, 33] l2 = [22, 33, 44 ...
Sublime Text3 & MinGW & LLVM CLang 安装配置C-C++编译环境
Sublime Text是一款强大的跨平台代码编辑器,小巧而且丰富实用的功能是Visual Studio不能比拟的,但是编译运行是一个软肋,本文通过在sublime中配置g++编译器实现程序的编译功能 ...

Android 音视频开发(三)：使用 AudioTrack 播放PCM音频