音视频/FFmpeg #Qt

Qt-FFmpeg开发-使用libavcodec API的音频解码示例（MP3转pcm）

音视频/FFmpeg #Qt
Qt-FFmpeg开发-使用libavcodec API的音频解码示例（MP3转pcm）

更多精彩内容
个人内容分类汇总
音视频开发

1、概述

最近研究了一下FFmpeg开发，功能实在是太强大了，网上ffmpeg3、4的文章还是很多的，但是学习嘛，最新的还是不能放过，就选了一个最新的ffmpeg n5.1.2版本，和3、4版本api变化还是挺大的；

这是一个libavcodec API示例；

这里主要是研究FFmpeg官方示例产生的一个程序，官方示例可以看Examples；

由于官方示例有一些小问题，编译没通过，并且是通过命令行执行，不方便，这里通过修改为使用Qt实现这个音频解码为PCM文件的示例。

开发环境说明

系统：Windows10、Ubuntu20.04
Qt版本：V5.12.5
编译器：MSVC2017-64、GCC/G++64
FFmpeg版本：n5.1.2
- 官方下载
- 我使用的库

2、实现效果

将.mp3文件解码转换为.pcm文件；（PCM数据时最原始的音频数据）；

使用Qt重新实现，方便操作，便于使用；

解决官方示例中解码失败程序会终止问题；

关键步骤加上详细注释，比官方示例更便于学习。

实现效果如下：

3、主要代码

啥也不说了，直接上代码，一切有注释

widget.h文件

#ifndef WIDGET_H

#define WIDGET_H

#include <QFile>

#include <QWidget>

QT_BEGIN_NAMESPACE

namespace Ui { class Widget; }

QT_END_NAMESPACE

struct AVCodecParserContext;

struct AVCodecContext;

struct AVCodec;

struct AVPacket;

struct AVFrame;

class Widget : public QWidget

{

    Q_OBJECT

public:

    Widget(QWidget *parent = nullptr);

    ~Widget();

private slots:

    void on_but_in_clicked();

    void on_but_out_clicked();

    void on_but_start_clicked();

private:

    int  initDecode();

    int  decode(QFile& fileOut);

    void showError(int err);

    void showLog(const QString& log);

private:

    Ui::Widget *ui;

    AVCodecParserContext*   m_parserContex  = nullptr;             // 裸流解析器

    AVCodecContext*         m_context       = nullptr;             // 解码器上下文

    const AVCodec*          m_codec         = nullptr;             // 音频解码器

    AVPacket*               m_packet        = nullptr;             // 未解码的原始数据

    AVFrame*                m_frame         = nullptr;             // 解码后的数据帧

};

#endif // WIDGET_H

widget.cpp文件

#include "widget.h"

#include "ui_widget.h"

#include <qfiledialog.h>

#include <QDebug>

#include <qthread.h>

#include <qtimer.h>

extern "C" {        // 用C规则编译指定的代码

#include <libavutil/frame.h>

#include <libavutil/mem.h>

#include <libavcodec/avcodec.h>

}

#define AUDIO_INBUF_SIZE 20480

#define AUDIO_REFILL_THRESH 4096

Widget::Widget(QWidget *parent)

    : QWidget(parent)

    , ui(new Ui::Widget)

{

    ui->setupUi(this);

    this->setWindowTitle(QString("使用libavcodec API的音频解码示例（mp3转pcm） V%1").arg(APP_VERSION));

}

Widget::~Widget()

{

    delete ui;

}

/**

 * @brief    自定义非阻塞延时

 * @param ms

 */

void msleep(int ms)

{

    QEventLoop loop;

    QTimer::singleShot(ms, &loop, SLOT(quit()));

    loop.exec();

}

void Widget::showLog(const QString &log)

{

    ui->textEdit->append(log);

}

/**

 * @brief        显示ffmpeg函数调用异常信息

 * @param err

 */

void Widget::showError(int err)

{

    static char m_error[1024];

    memset(m_error, 0, sizeof (m_error));        // 将数组置零

    av_strerror(err, m_error, sizeof (m_error));

    showLog(QString("Error：%1  %2").arg(err).arg(m_error));

}

/**

 * @brief 获取输入文件路径

 */

void Widget::on_but_in_clicked()

{

    QString strName = QFileDialog::getOpenFileName(this, "选择用于解码的.mp3音频文件~！", "/", "音频 (*.mp3);");

    if(strName.isEmpty())

    {

        return;

    }

    ui->line_fileIn->setText(strName);

}

/**

 * @brief 获取解码后的原始音频文件保存路径

 */

void Widget::on_but_out_clicked()

{

    QString strName = QFileDialog::getSaveFileName(this, "解码后数据保存到~！", "/", "原始音频 (*.pcm);");

    if(strName.isEmpty())

    {

        return;

    }

    ui->line_fileOut->setText(strName);

}

void Widget::on_but_start_clicked()

{

    int ret = initDecode();

    if(ret < 0)

    {

        showError(ret);

    }

    avcodec_free_context(&m_context);   // 释放编解码器上下文和与之相关的所有内容，并将NULL写入提供的指针。

    av_parser_close(m_parserContex);

    av_frame_free(&m_frame);

    av_packet_free(&m_packet);

}

QString get_format_from_sample_fmt(int fmt)

{

    typedef struct sample_fmt_entry {

        enum AVSampleFormat sample_fmt;

        QString fmt_be;          // 大端模式指令

        QString fmt_le;          // 小端模式指令

    }sample_fmt_entry;

    sample_fmt_entry sample_fmt_entryes[] = {

        { AV_SAMPLE_FMT_U8,  "u8",    "u8"    },

        { AV_SAMPLE_FMT_S16, "s16be", "s16le" },

        { AV_SAMPLE_FMT_S32, "s32be", "s32le" },

        { AV_SAMPLE_FMT_FLT, "f32be", "f32le" },

        { AV_SAMPLE_FMT_DBL, "f64be", "f64le" },

    };

    for(int i = 0; i < FF_ARRAY_ELEMS(sample_fmt_entryes); i++)

    {

        sample_fmt_entry entry = sample_fmt_entryes[i];

        if(fmt == entry.sample_fmt)

        {

            return AV_NE(entry.fmt_be, entry.fmt_le);   // AV_NE：判断大小端

        }

    }

    return QString();

}

/**

 * @brief   开始解码

 * @return

 */

int Widget::initDecode()

{

    QString strIn  = ui->line_fileIn->text();

    QString strOut = ui->line_fileOut->text();

    if(strIn.isEmpty() || strOut.isEmpty())

    {

        return AVERROR(ENOENT);        // 返回文件不存在的错误码

    }

    m_packet = av_packet_alloc();      // 创建一个AVPacket

    if(!m_packet)

    {

        return AVERROR(ENOMEM);        // 返回无法分配内存的错误码

    }

    m_frame = av_frame_alloc();      // 创建一个AVFrame

    if(!m_frame)

    {

        return AVERROR(ENOMEM);        // 返回无法分配内存的错误码

    }

    // 通过ID查询MPEG音频解码器

    m_codec = avcodec_find_decoder(AV_CODEC_ID_MP2);

    if(!m_codec)

    {

        return AVERROR(ENXIO);        // 找不到解码器

    }

    m_parserContex = av_parser_init(m_codec->id);

    if(!m_parserContex)

    {

        return AVERROR(ENOMEM);        // 解析器初始化失败

    }

    m_context = avcodec_alloc_context3(m_codec);  // 分配AVCodecContext并将其字段设置为默认值

    if(!m_context)

    {

        return AVERROR(ENOMEM);        // 解码器上下文创建失败

    }

    // 使用给定的AVCodec初始化AVCodecContext。

    int ret = avcodec_open2(m_context, m_codec, nullptr);

    if(ret < 0)

    {

        return ret;

    }

    // 打开输入文件

    QFile fileIn(strIn);

    if(!fileIn.open(QIODevice::ReadOnly))

    {

        return AVERROR(ENOENT);

    }

    // 打开输出文件

    QFile fileOut(strOut);

    if(!fileOut.open(QIODevice::WriteOnly))

    {

        return AVERROR(ENOENT);

    }

    showLog("开始解码！");

    msleep(1);

    QByteArray buf = fileIn.readAll();        // 读取所有数据

    char inbuf[AUDIO_INBUF_SIZE];

    while(buf.count() > 0)

    {

        int len = (buf.count() <= AUDIO_INBUF_SIZE) ? buf.count() : AUDIO_INBUF_SIZE;

        memcpy(inbuf, buf.data(), len);

        // 解析数据包

        ret = av_parser_parse2(m_parserContex, m_context, &m_packet->data, &m_packet->size,

                               reinterpret_cast<const uchar*>(inbuf),        // 这里不能直接使用buf.data(),否则会出现[mp2 @ 000001c8dbd40b00] Multiple frames in a packet.

                               len,

                               AV_NOPTS_VALUE, AV_NOPTS_VALUE, 0);

        if(ret < 0)

        {

            break;

        }

        buf.remove(0, ret);  // 移除已解析的数据

        if(m_packet->size)

        {

            ret = decode(fileOut);

            if(ret < 0)

            {

//                return ret;

            }

        }

    }

    m_packet->data = nullptr;

    m_packet->size = 0;

    decode(fileOut);               // 需要传入空的数据帧才可以将解码器中所有数据读取出来

    enum AVSampleFormat sfmt = m_context->sample_fmt;

    // 检查样本格式是否为平面

    if(av_sample_fmt_is_planar(sfmt))

    {

        const char* name = av_get_sample_fmt_name(sfmt);  // 获取音频样本格式名称

        showLog(QString("警告：解码器生成的样本格式是平面格式（%1）。此示例将仅输出第一个通道。").arg(name));

        sfmt = av_get_packed_sample_fmt(sfmt);   // 获取样本格式的替代格式

    }

    // 音频通道数

#if FF_API_OLD_CHANNEL_LAYOUT

    int channels = m_context->channels;

#else

    int channels = m_context->ch_layout.nb_channels;

#endif

    QString strFmt = get_format_from_sample_fmt(sfmt);

    if(!strFmt.isEmpty())

    {

        showLog(QString("使用下列命令播放输出音频文件！\n"

                        "ffplay -f %1 -ac %2 -ar %3 %4\n")

                        .arg(strFmt).arg(channels)

                        .arg(m_context->sample_rate).arg(strOut));

    }

    return 0;

}

/**

 * @brief           解码并写入文件

 * @param fileOut

 * @return

 */

int Widget::decode(QFile &fileOut)

{

    // 将包含压缩数据的数据包发送到解码器

    int ret = avcodec_send_packet(m_context, m_packet);   // 注意：官方Demo中这里如果返回值<0则终止程序，由于数据中有mp3文件头，所以一开始会有返回值<0的情况

    // 读取所有输出帧（通常可以有任意数量的输出帧

    while (ret >= 0)

    {

        // 读取解码后的数据帧

        int ret = avcodec_receive_frame(m_context, m_frame);

        if(ret == AVERROR(EAGAIN)   // 资源暂时不可用

        || ret == AVERROR_EOF)      // 文件末尾

        {

            return 0;

        }

        else if(ret < 0)

        {

            return ret;

        }

        // 返回每个样本的字节数。例如格式为AV_SAMPLE_FMT_U8，则字节数为1字节

        int size = av_get_bytes_per_sample(m_context->sample_fmt);   // 返回值不会小于0

        for(int i = 0; i < m_frame->nb_samples; ++i)   // 音频样本数（采样率）

        {

#if FF_API_OLD_CHANNEL_LAYOUT

            for(int j = 0; j < m_context->channels; ++j)         // 5.1.2以后版本会弃用channels

#else

            for(int j = 0; j < m_context->ch_layout.nb_channels; ++j)

#endif

            {

                fileOut.write((const char*)(m_frame->data[j] + size * i), size);

            }

        }

    }

    return 0;

}

4、完整源代码

github
gitee

Qt-FFmpeg开发-音频解码为PCM文件（9）的更多相关文章

最简单的基于FFMPEG的音频编码器（PCM编码为AAC）
http://blog.csdn.net/leixiaohua1020/article/details/25430449 本文介绍一个最简单的基于FFMPEG的音频编码器.该编码器实现了PCM音频采样 ...
基于FFmpeg的音频编码（PCM数据编码成AAC android）
概述在Android上实现录音,并利用 FFmpeg将PCM数据编码成AAC. 详细代码下载:http://www.demodashi.com/demo/10512.html 之前做的一个demo ...
FFmpeg 裁剪——音频解码
配置ffmpeg,只留下某些音频的配置: ./configure --enable-shared --disable-yasm --enable-memalign-hack --enable-gpl ...
FFMPEG视音频解码【一】
多媒体的时代,得多了解点编解码的技术才行,而ffmpeg为我们提供了一系列多媒体编解码的接口,如何用好这些接口达到自己所需要的目的,这也是一门重要的学问. 要是了解得不够,总是会遇到一堆又一堆问题:网 ...
在64位的ubuntu 14.04 上开展32位Qt 程序开发环境配置（pro文件中增加 QMAKE_CXXFLAGS += -m32 命令）
为了能中一个系统上开发64或32位C++程序,费了些周折,现在终于能够开始干过了.在此记录此时针对Q5.4版本的32位开发环境配置过程. 1. 下载Qt 5.4 的32位版本,进行安装,安装过程中会发 ...
Qt + FFmpeg 本地音频播放器
http://pan.baidu.com/s/1hqoYXrI
[总结]FFMPEG视音频编解码零基础学习方法--转
ffmpeg编解码学习目录(?)[-] ffmpeg程序的使用ffmpegexeffplayexeffprobeexe 1 ffmpegexe 2 ffplayexe 3 ffprobeexe ...
FFMPEG视音频编解码零基础学习方法
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的“大神”,有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然发现了一个问题:在“ ...
FFMPEG视音频编解码零基础学习方法－b
感谢大神分享,虽然现在还看不懂,留着大家一起看啦 PS:有不少人不清楚“FFmpeg”应该怎么读.它读作“ef ef em peg” 0. 背景知识本章主要介绍一下FFMPEG都用在了哪里(在这里仅 ...
[总结]FFMPEG视音频编解码零基础学习方法
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的“大神”,有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然发现了一个问题:在“ ...

随机推荐

CentOS 6.3挂载读写NTFS分区(ntfs-3g) [亲测成功]
CentOS 6.3挂载读写NTFS分区(ntfs-3g) CentOS不像Fedora,默认是没有自动挂载NTFS的,而它可以利用NTFS-3G来实现挂载及读写. NTFS-3G 是一个开源的软件, ...
How Python Handles Big Files
The Python programming language has become more and more popular in handling data analysis and proc ...
Pytorch-tensor的感知机,链式法则
1.单层感知机单层感知机的主要步骤: 1.对数据进行一个权重的累加求和,求得∑ 2.将∑经过一个激活函数Sigmoid,得出值O 3.再将O,经过一个损失函数mse_loss,得出值loss 4.根 ...
WPF随笔收录-DataGrid固定右侧列
一.前言在项目开发过程中,DataGrid是经常使用到的一个数据展示控件,而通常表格的最后一列是作为操作列存在,比如会有编辑.删除等功能按钮.但WPF的原始DataGrid中,默认只支持固定左侧列, ...
力扣537(java)-复数乘法（中等）
题目: 复数可以用字符串表示,遵循 "实部+虚部i" 的形式,并满足下述条件: 实部是一个整数,取值范围是 [-100, 100]虚部也是一个整数,取值范围是 [-100, ...
HarmonyOS NEXT应用开发—在Native侧实现进度通知功能
介绍本示例通过模拟下载场景介绍如何将Native的进度信息实时同步到ArkTS侧. 效果图预览使用说明点击"Start Download"按钮后,Native侧启动子线程模拟 ...
从原理到操作，让你在 Apache APISIX 中代理 Dubbo3 服务更便捷
简介: 本文为大家介绍了如何借助 Apache APISIX 实现 Dubbo Service 的代理,通过引入 dubbo-proxy 插件便可为 Dubbo 框架的后端系统构建更简单更高效的流量链 ...
DTCC 2020 | 阿里云赵殿奎：PolarDB的Oracle平滑迁移之路
简介: Oracle兼容性是业务客户从Oracle生态迁移到PolarDB生态的第一步也是至关重要的一步,PolarDB通过不断沉淀支持大量实际业务的真实Oracle兼容性功能,确保客户业务可以真正做 ...
[FE] 关于网页的一些反爬手段的解析思路，比如 58 等
这里主要是贴一些资料,有兴趣的可以再深入研究,比如做一些自动化库. www.cnblogs.com/TRHX/p/11740616.html blog.csdn.net/DzzzzzZzzzz/art ...
[ELK] 生产环境中 Elasticsearch 的重要配置项
配置 Elasticsearch https://www.elastic.co/guide/en/elasticsearch/reference/current/settings.html 重要的 E ...

Qt-FFmpeg开发-音频解码为PCM文件（9）

音视频/FFmpeg #Qt

Qt-FFmpeg开发-使用libavcodec API的音频解码示例（MP3转pcm）

1、概述

2、实现效果

3、主要代码

4、完整源代码

Qt-FFmpeg开发-音频解码为PCM文件（9）的更多相关文章

随机推荐

热门专题