MATLAB之图像与音频信号处理
原理简介
离散傅立叶、离散余弦和离散小波变换是图像、音频信号常用基础操作,时域信号转换到不同变换域以后,会导致不同程度的能量集中,信息隐藏利用这个原理在变换域选择适当位置系数进行修改,嵌入信息,并确保图像、音频信号经处理后感官质量无明显变化。
变换定义
一维离散傅立叶变换对定义:

一维离散余弦变换对定义:

一维连续小波变换对定义:

二维离散傅立叶变换对定义:

二维离散余弦变换对定义:

用离散傅立叶变换分析合成音频和图像
分析合成音频文件包括以下步骤:
l 读取音频文件数据
l 一维离散傅立叶变换
l 一维离散傅立叶逆变换
l 观察结果
第一步:读取音频文件数据
新建一个 m 文件,另存为 example11.m,输入以下命令:
clc;
clear;
l = [1, 40000];
[fn, pn] = uigetfile('*.wav', '请选择音频文件');
[x, fs] = audioread(strcat(pn, fn),l);
len = length(x)
uigetfile 是文件对话框函数,提供图形界面供用户选择所需文件,返回目标的目录名和文件名。
函数原型:y= audioread (FILE)
功能:读取音频格式文件内容
输入参数:file 表示音频文件名,字符串
返回参数:y 表示音频样点,浮点型
第二步:一维离散傅立叶变换
新建一个 m 文件,另存为 example12.m,输入以下命令:
xf = fft(x); f1 = [0:len-1] * fs / len; xff = fftshift(xf); hl = floor(len / 2); f2 = [-hl:hl] * fs / len;
fft 函数对输入参数进行一维离散傅立叶变换并返回其系数,对应频率从 0 到 fs(采样频率),使用 fftshift 将零频对应系数移至中央。上述代码还计算了离散样点对应的频率值,以便更好地观察频谱。
第三步:一维离散傅立叶逆变换
新建一个 m 文件,另存为 example13.m,输入以下命令:
xsync = ifft(xf);
ifft 函数对输入参数进行一维离散傅立叶逆变换并返回其系数。
第四步:观察结果
新建一个 m 文件,另存为 example14.m,输入以下命令:
figure;
subplot(2, 2, 1);plot(x);title('original audio');
subplot(2, 2, 2);plot(xsync);title('synthesize audio');
subplot(2, 2, 3);plot(f1, abs(xf));title('fft coef. of audio');
subplot(2, 2, 4);plot(f2(1:len), abs(xff));title('fftshift coef. of auio');
figure(n)表示创建第 n 个图形窗。
subplot 是子绘图函数,第一、二个参数指明子图像布局方式,例如,若参数为 2,3 则表示画面共分为 2 行,每行有 3 个子图像。第三个参数表明子图像序号,排序顺序为从左至右,从上至下。
plot 是绘图函数,默认使用方式为 plot(y),参数 y 是要绘制的数据;如果需要指明图像横轴显示序列,则命令行为 plot(x, y),默认方式等同于 plot([0..len-1], y),len 为序列 y 的长度。

分析合成图像文件包括以下步骤:
l 读取图像文件数据
l 二维离散傅立叶变换
l 二维离散傅立叶逆变换
l 观察结果
第一步:读取图像文件数据
新建一个 m 文件,另存为 example21.m,输入以下命令:
[fn, pn] = uigetfile('*.png', '请选择图像文件');
[x, map] = imread(strcat(pn, fn), 'png');
I = rgb2gray(x);
函数原型:A = imread(filename,fmt)
功能:读取 fmt 指定格式的图像文件内容
输入参数:filename 表示图像文件名,字符串 Fmt 表示图像文件格式名,字符串,函数支持的图像格式包括:JPEG,TIFF,GIF,BMP 等等,当参数中不包括文件格式名时,函数尝试推断出文件格式。
返回参数:A 表示图像数据内容,整型 rgb2gray 将 RGB 图像转换为灰度图。
第二步:二维离散傅立叶变换
新建一个 m 文件,另存为 example22.m,输入以下命令:
xf = fft2(I); xff = fftshift(xf);
fft2 函数对输入参数进行二维离散傅立叶变换并返回其系数,使用 fftshift 将零频对应系数移至中央。
第三步:二维离散傅立叶逆变换
新建一个 m 文件,另存为 example23.m,输入以下命令:
xsync = ifft2(xf);
ifft2 函数对输入参数进行二维离散傅立叶逆变换并返回其系数。
第四步:观察结果
新建一个 m 文件,另存为 example24.m,输入以下命令:
figure;
subplot(2, 2, 1);imshow(x);title('original image');
subplot(2, 2, 2);imshow(uint8(abs(xsync)));title('synthesize image');
subplot(2, 2, 3);mesh(abs(xf));title('fft coef. of image');
subplot(2, 2, 4);mesh(abs(xff));title('fftshift coef. of image');
imshow 是二维数据绘图函数,mesh 通过三维平面显示数据。

用离散余弦变换分析合成音频和图像
分析合成音频文件包括以下步骤:
l 读取音频文件数据
l 一维离散余弦变换
l 一维离散余弦逆变换
l 观察结果
第一步:一维离散余弦变换
新建一个 m 文件,另存为 example31.m,输入以下命令:
xf = dct(x);
dct 函数对输入参数进行一维离散余弦变换并返回其系数,对应频率从 0 到 fs(采样频率)。
第二步:一维离散余弦逆变换
新建一个 m 文件,另存为 example32.m,输入以下命令:
xsync = idct(xf); [row,col]=size(x); xff=zeros(row,col); xff(1:row,1:col)=xf(1:row,1:col); y=idct(xff);
idct 函数对输入参数进行一维离散余弦逆变换并返回其系数。离散余弦变换常用于图像压缩,可以尝试只使用部分系数重构语言,通过观察可发现,原始音频和合成后音频两者差别不大。
第三步:观察结果
新建一个 m 文件,另存为 example33.m,输入以下命令:
figure;
subplot(2, 2, 1);plot(x);title('original audio');
subplot(2, 2, 2);plot(xsync);title('synthesize audio');
subplot(2, 2, 3);plot(f1, abs(xf));title('fft coef. of audio');
subplot(2, 2, 4);plot(f2(1:len), abs(xff));title('fftshift coef. of auio');

分析合成图像文件包括以下步骤:
l 读取图像文件数据
l 二维离散余弦变换
l 二维离散余弦逆变换
l 观察结果
第一步:二维离散余弦变换
新建一个 m 文件,另存为 example41.m,输入以下命令:
xf = dct2(I);
dct2 函数对输入参数进行二维离散余弦变换并返回其系数。
第二步:二维离散余弦逆变换
新建一个 m 文件,另存为 example42.m,输入以下命令:
xsync = uint8(idct2(xf)); [row, col] = size(I); lenr = round(row * 4 / 5); lenc = round(col * 4 / 5); xff = zeros(row, col); xff(1:lenr, 1:lenc) = xf(1:lenr, 1:lenc); y = uint8(idct2(xff));
idct2 函数对输入参数进行二维离散余弦逆变换并返回其系数。可以尝试使用部分系数重构图像,本例中使用了系数矩阵中 4/5 的数据,其它部分置零。为了保证图像能正确显示,使用 uint8 对重构图像原始数据进行了数据类型转换,确保其取值范围在 0 到 255 之间。
第三步:观察结果
请输入命令显示四个子图,分别是原始图像、使用全部系数恢复的图像,使用部分系数恢复的图像和用三维立体图方式显示系数。
新建一个 m 文件,另存为 example43.m,输入以下命令:
figure;
subplot(2, 2, 1);imshow(x);title('original image');
subplot(2, 2, 2);imshow(uint8(abs(xsync)));title('synthesize image');
subplot(2, 2, 3);imshow(uint8(abs(y)));title('part synthesize image');
subplot(2, 2, 4);mesh(abs(xff));title('fftshift coef. of image');

用离散小波变换分析合成音频和图像
分析合成音频文件包括以下步骤:
l 读取音频文件数据
l 一维离散小波变换
l 一维离散小波逆变换
l 观察结果
详细操作步骤为:
第一步:一维离散小波变换
新建一个 m 文件,另存为 example51.m,输入以下命令:
[C, L] = wavedec(x, 2, 'db4');
wavedec 函数对输入参数进行一维离散小波变换并返回其系数 C 和各级系数长度L。第二个参数指明小波变换的级数,第三个参数指明小波变换使用的小波基名称。
第二步:一维离散小波逆变换
新建一个 m 文件,另存为 example52.m,输入以下命令:
xsync = waverec(C, L, 'db4'); cA2 = appcoef(C, L, 'db4', 2); cD2 = detcoef(C, L, 2); cD1 = detcoef(C, L, 1);
waverec 函数对输入参数进行一维离散小波逆变换并返回其系数。
appcoef 返回小波系数近似分量,第一个参数 C、第二个参数 L 是 wavedec 的返回参数,为各级小波系数和其长度,第三个参数指明小波基名称,第四个参数指明级。
detcoef 返回小波系数细节分量,第一个参数 C、第二个参数 L 是 wavedec 的返回参数,为各级小波系数和其长度,第三个参数指明级数。
第三步:观察结果
新建一个 m 文件,另存为 example53.m,输入以下命令:
figure;
subplot(2, 3, 1);plot(x);title('original audio');
subplot(2, 3, 2);plot(xsync);title('synthesize audio');
subplot(2, 3, 4);plot(cA2);title('app coef. of audio');
subplot(2, 3, 5);plot(cD2);title('det coef. of auio');
subplot(2, 3, 6);plot(cD1);title('det coef. of auio');

分析合成图像文件包括以下步骤:
l 读取图像文件数据
l 二维离散小波变换
l 二维离散小波逆变换
l 观察结果
第一步:二维离散小波变换
新建一个 m 文件,另存为 example61.m,输入以下命令:
sx = size(I); [cA1, cH1, cV1, cD1] = dwt2(I, 'bior3.7');
dwt2 函数对输入参数进行二维一级离散小波变换并返回近似分量,水平细节分量,垂直细节分量和对角线细节分量。
如果要对图像进行多级小波分解,使用 wavedec2 函数。
第二步:二维离散小波逆变换
新建一个 m 文件,另存为 example62.m,输入以下命令:
xsync = uint8(idwt2(cA1, cH1, cV1, cD1, 'bior3.7', sx)); A1 = uint8(idwt2(cA1, [], [], [], 'bior3.7', sx)); H1 = uint8(idwt2([], cH1, [], [], 'bior3.7', sx)); V1 = uint8(idwt2([], [], cV1, [], 'bior3.7', sx)); D1 = uint8(idwt2([], [], [], cD1, 'bior3.7', sx));
idwt2 函数对输入参数进行二维离散小波逆变换并返回其系数。可以尝试仅使用近似分量、水平细节分量、垂直细节分量或对角线细节分量重构图像。
第三步:观察结果
输入命令显示六个子图,分别是原始图像、使用全部系数恢复的图像、小波系数近似分量、水平细节分量、垂直细节分量和对角线细节分量。
新建一个 m 文件,另存为 example63.m,输入以下命令:
figure;
subplot(2, 3, 1);imshow(x);title('original image');
subplot(2, 3, 2);imshow(uint8(abs(xsync)));title('synthesize image');
subplot(2, 3, 3);mesh(A1);title('app coef. of image ');
subplot(2, 3, 4);mesh(H1);title('hor coef. of image ');
subplot(2, 3, 5);mesh(V1);title('ver coef. of image ');
subplot(2, 3, 6);mesh(D1);title('dia coef. of image ');

MATLAB之图像与音频信号处理的更多相关文章
- DAY13 Matlab实现图像错切源代码
Matlab实现图像错切源代码 %错切im=(imread('robot.jpg'));im1=rgb2gray(im);figure,imshow(im1);[row,col]=size(im1); ...
- matlab 对图像操作的函数概览
转自博客:http://blog.163.com/fei_lai_feng/blog/static/9289962200991713415422/ 一. 读写图像文件 1. imread imread ...
- matlab中的实时音频
音频系统工具箱™针对实时音频处理进行了优化.audioDeviceReader, audioDeviceWriter, audioPlayerRecorder, dsp.AudioFileReader ...
- 【matlab】图像直方图
使用imhist函数(要先用rgb2gray转化为灰度图像) 利用matlab计算图像直方图函数为imhist() 具体用法: imhist( i );直接显示图像i的灰度直方图: imhist(i, ...
- SFML从入门到放弃(2) 图像和音频
SFML从入门到放弃(2) 图像和音频 精灵 精灵(sf::Sprite)就是截取纹理(sf::Texture)的一块 或者重复纹理贴图 初始化精灵和纹理的一些方法: sf::Sprite init_ ...
- MATLAB中图像的基本操作
MATLAB中图像的基本操作 1.读取.显示图片 MATLAB中提供了immread()与imshow()函数读取和显示图片.其中读取函数imread()原型: imread: A = imread( ...
- 使用matlab处理图像的基础知识
MATLAB基本函数一 矩阵运算 1.基本算数运算(加减乘除) + -运算要求矩阵维数相同,例m*n * /运算,例A=B*C,B矩阵是m*n矩阵,B是n*p矩阵,则A是m*p矩阵 A/B相当于A*i ...
- 用matlab给图像加高斯噪声和椒盐噪声(不调用imnoise函数)
图像画面中的噪声,大致可以分为两类:高斯噪声和椒盐噪声.在这里,我们先看下图像中两种噪声各自的特征. 椒盐噪声:噪声幅值基本相同,但出现位置随机. 高斯噪声:图像中每一点都存在噪声,但幅值是随机分布的 ...
- Web开发——HTML基础(图像、音频和视频内容)
参考: 参考:HTML中的图像 参考:视频和音频内容 目录: 1.HTML中的图像 1.1 我们如何在网页上放置图像? (1)替代文字(alt) (2)宽度和高度 (3)图片标题 1.2 用图形和图形 ...
随机推荐
- [转] java开源游戏
收藏一下 triplea Triplea是一个开放源码的boardgame.它允许玩家选择各种各样的战略版图游戏(如:轴心国或同盟军).TripleA引擎支持联网对战,支持声音,支持使用XML文 ...
- mui的app页面使用layui填充数据
在mui的开发中有个坑,mui.plusReady在web上使用时是不会起作用的,只能在app上才行,所以推荐自己测试时使用mui.ready去写加载时的方法. 前端请求的返回格式为json,所以在后 ...
- 【数据结构】线段树(Segment Tree)
假设我们现在拿到了一个非常大的数组,对于这个数组里面的数字要反复不断地做两个操作. 1.(query)随机在这个数组中选一个区间,求出这个区间所有数的和. 2.(update)不断地随机修改这个数组中 ...
- java学习二
一.类 1.类是模子,确定对象将会拥有的特征(属性)和行为(方法) 2.类的特点: (1).类是对象的类型 (2).具有相同属性和方法的一组对象的集合 3.类是抽象的概念,仅仅是模板,比如说:“手机” ...
- Laravel框架内实现api文档:markdown转为html
前后端分离的工作模式于今是非常流行了,前后端工作的对接,就离开不了API文档的辅助. 根据自己以往的工作经历,以及了解的一些资讯,API文档的建立,无非以下几种方式: 1. word文档模板 2. 第 ...
- Vuex模块化
上图是vuex的结构图vuex即 store, 包含State,Action,Mutations, 每一个vue项目都需要使用vuex做组件之间的数据共享 使用场景: 数据最终存放在store的Sta ...
- Liunx软件安装之Zabbix监控软件
Zabbix 是什么 zabbix(音同 za:bix)是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案. zabbix 能监视各种网络参数,保证服务器系统的安全运营 ...
- Liunx学习总结(七)--系统状态查看和统计
sar命令 sar 是一个非常强大的性能分析工具,它可以获取系统的 cpu/等待队列/磁盘IO/内存/网络等性能指标.功能多的必然结果是选项多,应用复杂,但只要知道一些常用的选项足以. 语法 sar ...
- js获取(包括中文)字符串长度与截取字符串
/** * @param begin 截取开始的索引 * @param num 截取的长度 */ //截取字符串(包括中文) function SetString(str, len) { var st ...
- 设计模式(C#)——02抽象工厂模式
推荐阅读: 我的CSDN 我的博客园 QQ群:704621321 在工厂模式中,一个工厂只能创建一种产品,但我们往往希望,一个工厂能创建一系列产品.很明显工厂模式已经不能满足我们的需 ...