Qt-FFmpeg开发-音频解码为PCM文件(9)
音视频/FFmpeg #Qt
Qt-FFmpeg开发-使用libavcodec API的音频解码示例(MP3转pcm)
更多精彩内容 |
---|
个人内容分类汇总 |
音视频开发 |
1、概述
- 最近研究了一下FFmpeg开发,功能实在是太强大了,网上ffmpeg3、4的文章还是很多的,但是学习嘛,最新的还是不能放过,就选了一个最新的ffmpeg n5.1.2版本,和3、4版本api变化还是挺大的;
- 这是一个libavcodec API示例;
- 这里主要是研究FFmpeg官方示例产生的一个程序,官方示例可以看Examples;
- 由于官方示例有一些小问题,编译没通过,并且是通过命令行执行,不方便,这里通过修改为使用Qt实现这个音频解码为PCM文件的示例。
开发环境说明
2、实现效果
- 将.mp3文件解码转换为.pcm文件;(PCM数据时最原始的音频数据);
- 使用Qt重新实现,方便操作,便于使用;
- 解决官方示例中解码失败程序会终止问题 ;
- 关键步骤加上详细注释,比官方示例更便于学习。
实现效果如下:
3、主要代码
啥也不说了,直接上代码,一切有注释
widget.h文件
#ifndef WIDGET_H
#define WIDGET_H #include <QFile>
#include <QWidget> QT_BEGIN_NAMESPACE
namespace Ui { class Widget; }
QT_END_NAMESPACE struct AVCodecParserContext;
struct AVCodecContext;
struct AVCodec;
struct AVPacket;
struct AVFrame; class Widget : public QWidget
{
Q_OBJECT public:
Widget(QWidget *parent = nullptr);
~Widget(); private slots: void on_but_in_clicked(); void on_but_out_clicked(); void on_but_start_clicked(); private:
int initDecode();
int decode(QFile& fileOut);
void showError(int err);
void showLog(const QString& log); private:
Ui::Widget *ui; AVCodecParserContext* m_parserContex = nullptr; // 裸流解析器
AVCodecContext* m_context = nullptr; // 解码器上下文
const AVCodec* m_codec = nullptr; // 音频解码器
AVPacket* m_packet = nullptr; // 未解码的原始数据
AVFrame* m_frame = nullptr; // 解码后的数据帧
};
#endif // WIDGET_Hwidget.cpp文件
#include "widget.h"
#include "ui_widget.h"
#include <qfiledialog.h>
#include <QDebug>
#include <qthread.h>
#include <qtimer.h> extern "C" { // 用C规则编译指定的代码
#include <libavutil/frame.h>
#include <libavutil/mem.h>
#include <libavcodec/avcodec.h>
} #define AUDIO_INBUF_SIZE 20480
#define AUDIO_REFILL_THRESH 4096 Widget::Widget(QWidget *parent)
: QWidget(parent)
, ui(new Ui::Widget)
{
ui->setupUi(this); this->setWindowTitle(QString("使用libavcodec API的音频解码示例(mp3转pcm) V%1").arg(APP_VERSION));
} Widget::~Widget()
{
delete ui;
} /**
* @brief 自定义非阻塞延时
* @param ms
*/
void msleep(int ms)
{
QEventLoop loop;
QTimer::singleShot(ms, &loop, SLOT(quit()));
loop.exec(); } void Widget::showLog(const QString &log)
{
ui->textEdit->append(log);
} /**
* @brief 显示ffmpeg函数调用异常信息
* @param err
*/
void Widget::showError(int err)
{
static char m_error[1024];
memset(m_error, 0, sizeof (m_error)); // 将数组置零
av_strerror(err, m_error, sizeof (m_error));
showLog(QString("Error:%1 %2").arg(err).arg(m_error));
} /**
* @brief 获取输入文件路径
*/
void Widget::on_but_in_clicked()
{
QString strName = QFileDialog::getOpenFileName(this, "选择用于解码的.mp3音频文件~!", "/", "音频 (*.mp3);");
if(strName.isEmpty())
{
return;
}
ui->line_fileIn->setText(strName);
} /**
* @brief 获取解码后的原始音频文件保存路径
*/
void Widget::on_but_out_clicked()
{
QString strName = QFileDialog::getSaveFileName(this, "解码后数据保存到~!", "/", "原始音频 (*.pcm);");
if(strName.isEmpty())
{
return;
}
ui->line_fileOut->setText(strName);
} void Widget::on_but_start_clicked()
{
int ret = initDecode();
if(ret < 0)
{
showError(ret);
} avcodec_free_context(&m_context); // 释放编解码器上下文和与之相关的所有内容,并将NULL写入提供的指针。
av_parser_close(m_parserContex);
av_frame_free(&m_frame);
av_packet_free(&m_packet);
} QString get_format_from_sample_fmt(int fmt)
{
typedef struct sample_fmt_entry {
enum AVSampleFormat sample_fmt;
QString fmt_be; // 大端模式指令
QString fmt_le; // 小端模式指令
}sample_fmt_entry; sample_fmt_entry sample_fmt_entryes[] = {
{ AV_SAMPLE_FMT_U8, "u8", "u8" },
{ AV_SAMPLE_FMT_S16, "s16be", "s16le" },
{ AV_SAMPLE_FMT_S32, "s32be", "s32le" },
{ AV_SAMPLE_FMT_FLT, "f32be", "f32le" },
{ AV_SAMPLE_FMT_DBL, "f64be", "f64le" },
}; for(int i = 0; i < FF_ARRAY_ELEMS(sample_fmt_entryes); i++)
{
sample_fmt_entry entry = sample_fmt_entryes[i];
if(fmt == entry.sample_fmt)
{
return AV_NE(entry.fmt_be, entry.fmt_le); // AV_NE:判断大小端
}
} return QString();
}
/**
* @brief 开始解码
* @return
*/
int Widget::initDecode()
{
QString strIn = ui->line_fileIn->text();
QString strOut = ui->line_fileOut->text();
if(strIn.isEmpty() || strOut.isEmpty())
{
return AVERROR(ENOENT); // 返回文件不存在的错误码
} m_packet = av_packet_alloc(); // 创建一个AVPacket
if(!m_packet)
{
return AVERROR(ENOMEM); // 返回无法分配内存的错误码
} m_frame = av_frame_alloc(); // 创建一个AVFrame
if(!m_frame)
{
return AVERROR(ENOMEM); // 返回无法分配内存的错误码
} // 通过ID查询MPEG音频解码器
m_codec = avcodec_find_decoder(AV_CODEC_ID_MP2);
if(!m_codec)
{
return AVERROR(ENXIO); // 找不到解码器
} m_parserContex = av_parser_init(m_codec->id);
if(!m_parserContex)
{
return AVERROR(ENOMEM); // 解析器初始化失败
} m_context = avcodec_alloc_context3(m_codec); // 分配AVCodecContext并将其字段设置为默认值
if(!m_context)
{
return AVERROR(ENOMEM); // 解码器上下文创建失败
} // 使用给定的AVCodec初始化AVCodecContext。
int ret = avcodec_open2(m_context, m_codec, nullptr);
if(ret < 0)
{
return ret;
} // 打开输入文件
QFile fileIn(strIn);
if(!fileIn.open(QIODevice::ReadOnly))
{
return AVERROR(ENOENT);
}
// 打开输出文件
QFile fileOut(strOut);
if(!fileOut.open(QIODevice::WriteOnly))
{
return AVERROR(ENOENT);
} showLog("开始解码!");
msleep(1);
QByteArray buf = fileIn.readAll(); // 读取所有数据
char inbuf[AUDIO_INBUF_SIZE];
while(buf.count() > 0)
{
int len = (buf.count() <= AUDIO_INBUF_SIZE) ? buf.count() : AUDIO_INBUF_SIZE;
memcpy(inbuf, buf.data(), len);
// 解析数据包
ret = av_parser_parse2(m_parserContex, m_context, &m_packet->data, &m_packet->size,
reinterpret_cast<const uchar*>(inbuf), // 这里不能直接使用buf.data(),否则会出现[mp2 @ 000001c8dbd40b00] Multiple frames in a packet.
len,
AV_NOPTS_VALUE, AV_NOPTS_VALUE, 0);
if(ret < 0)
{
break;
}
buf.remove(0, ret); // 移除已解析的数据 if(m_packet->size)
{
ret = decode(fileOut);
if(ret < 0)
{
// return ret;
}
}
}
m_packet->data = nullptr;
m_packet->size = 0;
decode(fileOut); // 需要传入空的数据帧才可以将解码器中所有数据读取出来 enum AVSampleFormat sfmt = m_context->sample_fmt;
// 检查样本格式是否为平面
if(av_sample_fmt_is_planar(sfmt))
{
const char* name = av_get_sample_fmt_name(sfmt); // 获取音频样本格式名称
showLog(QString("警告:解码器生成的样本格式是平面格式(%1)。此示例将仅输出第一个通道。").arg(name));
sfmt = av_get_packed_sample_fmt(sfmt); // 获取样本格式的替代格式
} // 音频通道数
#if FF_API_OLD_CHANNEL_LAYOUT
int channels = m_context->channels;
#else
int channels = m_context->ch_layout.nb_channels;
#endif
QString strFmt = get_format_from_sample_fmt(sfmt);
if(!strFmt.isEmpty())
{
showLog(QString("使用下列命令播放输出音频文件!\n"
"ffplay -f %1 -ac %2 -ar %3 %4\n")
.arg(strFmt).arg(channels)
.arg(m_context->sample_rate).arg(strOut));
} return 0;
} /**
* @brief 解码并写入文件
* @param fileOut
* @return
*/
int Widget::decode(QFile &fileOut)
{
// 将包含压缩数据的数据包发送到解码器
int ret = avcodec_send_packet(m_context, m_packet); // 注意:官方Demo中这里如果返回值<0则终止程序,由于数据中有mp3文件头,所以一开始会有返回值<0的情况 // 读取所有输出帧(通常可以有任意数量的输出帧
while (ret >= 0)
{
// 读取解码后的数据帧
int ret = avcodec_receive_frame(m_context, m_frame);
if(ret == AVERROR(EAGAIN) // 资源暂时不可用
|| ret == AVERROR_EOF) // 文件末尾
{
return 0;
}
else if(ret < 0)
{
return ret;
} // 返回每个样本的字节数。例如格式为AV_SAMPLE_FMT_U8,则字节数为1字节
int size = av_get_bytes_per_sample(m_context->sample_fmt); // 返回值不会小于0
for(int i = 0; i < m_frame->nb_samples; ++i) // 音频样本数(采样率)
{
#if FF_API_OLD_CHANNEL_LAYOUT
for(int j = 0; j < m_context->channels; ++j) // 5.1.2以后版本会弃用channels
#else
for(int j = 0; j < m_context->ch_layout.nb_channels; ++j)
#endif
{
fileOut.write((const char*)(m_frame->data[j] + size * i), size);
}
}
}
return 0;
}
4、完整源代码
Qt-FFmpeg开发-音频解码为PCM文件(9)的更多相关文章
- 最简单的基于FFMPEG的音频编码器(PCM编码为AAC)
http://blog.csdn.net/leixiaohua1020/article/details/25430449 本文介绍一个最简单的基于FFMPEG的音频编码器.该编码器实现了PCM音频采样 ...
- 基于FFmpeg的音频编码(PCM数据编码成AAC android)
概述 在Android上实现录音,并利用 FFmpeg将PCM数据编码成AAC. 详细 代码下载:http://www.demodashi.com/demo/10512.html 之前做的一个demo ...
- FFmpeg 裁剪——音频解码
配置ffmpeg,只留下某些音频的配置: ./configure --enable-shared --disable-yasm --enable-memalign-hack --enable-gpl ...
- FFMPEG视音频解码【一】
多媒体的时代,得多了解点编解码的技术才行,而ffmpeg为我们提供了一系列多媒体编解码的接口,如何用好这些接口达到自己所需要的目的,这也是一门重要的学问. 要是了解得不够,总是会遇到一堆又一堆问题:网 ...
- 在64位的ubuntu 14.04 上开展32位Qt 程序开发环境配置(pro文件中增加 QMAKE_CXXFLAGS += -m32 命令)
为了能中一个系统上开发64或32位C++程序,费了些周折,现在终于能够开始干过了.在此记录此时针对Q5.4版本的32位开发环境配置过程. 1. 下载Qt 5.4 的32位版本,进行安装,安装过程中会发 ...
- Qt + FFmpeg 本地音频播放器
http://pan.baidu.com/s/1hqoYXrI
- [总结]FFMPEG视音频编解码零基础学习方法--转
ffmpeg编解码学习 目录(?)[-] ffmpeg程序的使用ffmpegexeffplayexeffprobeexe 1 ffmpegexe 2 ffplayexe 3 ffprobeexe ...
- FFMPEG视音频编解码零基础学习方法
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的“大神”,有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然发现了一个问题:在“ ...
- FFMPEG视音频编解码零基础学习方法-b
感谢大神分享,虽然现在还看不懂,留着大家一起看啦 PS:有不少人不清楚“FFmpeg”应该怎么读.它读作“ef ef em peg” 0. 背景知识 本章主要介绍一下FFMPEG都用在了哪里(在这里仅 ...
- [总结]FFMPEG视音频编解码零基础学习方法
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的“大神”,有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然发现了一个问题:在“ ...
随机推荐
- linux 性能自我学习 ———— cpu 快速定位问题 [六]
前言 主要介绍一下cpu如何快速定位问题. 正文 cpu 的一些性能指标: 1. cpu 使用率 cpu 使用率描述了非空闲时间占总cpu时间的百分比,根据cpu上运行任务的不同,又被分为用户cpu. ...
- 抓包整理外篇——————https 抓包 [ 五]
前言 简单介绍一下https 抓包. 正文 可能有人一开始的时候发现抓包都抓不到,原因也很简单,那是因为https 需要解密. 那么为什么https 不解密呢? 那是因为证书信任问题. 下面先介绍,上 ...
- docker 应用篇————mysql容器[十二]
前言 简单介绍一下mysql容器. 正文 这里简单介绍一下mysql的容器. hub.docker.io给了我们一个启动的示例. docker run --name some-mysql -e MYS ...
- sumo简单安装及运行实例
下载解压并添加环境变量 记录一下今天SUMO的安装及使用经验,写的可能比较潦草,没看懂的小伙伴在下方评论,我看到一定会解答. 第一步先打开网址下载sumo: https://sourceforge.n ...
- 文本溢出显示省略号css
项目中常常有这种需要我们对溢出文本进行"..."显示的操作,单行多行的情况都有(具体几行得看设计师心情了),这篇随笔是我个人对这种情况解决办法的归纳,欢迎各路英雄指教. 单行 语法 ...
- 阿里云消息队列 Kafka-消息检索实践
简介: 本文章主要介绍消息队列使用过程中所遇到的消息丢失.重复消费等痛点问题的排查办法,以及消息队列 Kafka「检索组件」的场景实践,并对其关键技术进行解读.旨在帮助大家对消息队列 Kafka「检索 ...
- Fury:一个基于JIT动态编译的高性能多语言原生序列化框架
简介: Fury是一个基于JIT动态编译的多语言原生序列化框架,支持Java/Python/Golang/C++等语言,提供全自动的对象多语言/跨语言序列化能力,以及相比于别的框架最高20~200倍的 ...
- 阿里本地生活全域日志平台 Xlog 的思考与实践
简介: 作者:王宇(御田).当你踏进了编程的领域,代码和日志将是你最重要的伙伴".基于日志的问题排查是研发效能领域的重要部分,阿里集团本地生活在支撑多生态公司.多技术栈的背景下,逐渐沉淀了一 ...
- 【ESSD技术解读-02】企业级利器,阿里云 NVMe 盘和共享存储
简介: 当前 NVMe 云盘结合了业界最先进的软硬件技术,在云存储市场,首创性同时实现了 NVMe 协议 + 共享访问 + IO Fencing 技术.它在 ESSD 之上获得了高可靠.高可用.高性能 ...
- Java Spring项目中的CORS跨域开启的几种方式
引 在服务器端开启跨域的原理,一般都是通过在HTTP Headers中的响应头的Access-Control-Allow-Origin指定放行的域,来完成的. Access-Control-Allow ...