原理简介

离散傅立叶、离散余弦和离散小波变换是图像、音频信号常用基础操作,时域信号转换到不同变换域以后,会导致不同程度的能量集中,信息隐藏利用这个原理在变换域选择适当位置系数进行修改,嵌入信息,并确保图像、音频信号经处理后感官质量无明显变化。

变换定义

一维离散傅立叶变换对定义:

一维离散余弦变换对定义:

一维连续小波变换对定义:

二维离散傅立叶变换对定义:

二维离散余弦变换对定义:

用离散傅立叶变换分析合成音频和图像

分析合成音频文件包括以下步骤:

l     读取音频文件数据

l     一维离散傅立叶变换

l     一维离散傅立叶逆变换

l     观察结果

第一步:读取音频文件数据

新建一个 m 文件,另存为 example11.m,输入以下命令:

clc;
clear;
l = [1, 40000];
[fn, pn] = uigetfile('*.wav', '请选择音频文件');
[x, fs] = audioread(strcat(pn, fn),l);
len = length(x)

uigetfile 是文件对话框函数,提供图形界面供用户选择所需文件,返回目标的目录名和文件名。

函数原型:y= audioread (FILE)

功能:读取音频格式文件内容

输入参数:file 表示音频文件名,字符串

返回参数:y 表示音频样点,浮点型

第二步:一维离散傅立叶变换

新建一个 m 文件,另存为 example12.m,输入以下命令:

xf = fft(x);

f1 = [0:len-1] * fs / len;

xff = fftshift(xf);

hl = floor(len / 2);

f2 = [-hl:hl] * fs / len;

fft 函数对输入参数进行一维离散傅立叶变换并返回其系数,对应频率从 0 到 fs(采样频率),使用 fftshift 将零频对应系数移至中央。上述代码还计算了离散样点对应的频率值,以便更好地观察频谱。

第三步:一维离散傅立叶逆变换

新建一个 m 文件,另存为 example13.m,输入以下命令:

xsync = ifft(xf);

ifft 函数对输入参数进行一维离散傅立叶逆变换并返回其系数。

第四步:观察结果

新建一个 m 文件,另存为 example14.m,输入以下命令:

figure;

subplot(2, 2, 1);plot(x);title('original audio');

subplot(2, 2, 2);plot(xsync);title('synthesize audio');

subplot(2, 2, 3);plot(f1, abs(xf));title('fft coef. of audio');

subplot(2, 2, 4);plot(f2(1:len), abs(xff));title('fftshift coef. of auio');

figure(n)表示创建第  n 个图形窗。

subplot 是子绘图函数,第一、二个参数指明子图像布局方式,例如,若参数为 2,3 则表示画面共分为 2 行,每行有 3 个子图像。第三个参数表明子图像序号,排序顺序为从左至右,从上至下。

plot 是绘图函数,默认使用方式为 plot(y),参数 y 是要绘制的数据;如果需要指明图像横轴显示序列,则命令行为 plot(x, y),默认方式等同于 plot([0..len-1], y),len 为序列 y 的长度。

分析合成图像文件包括以下步骤:

l     读取图像文件数据

l     二维离散傅立叶变换

l     二维离散傅立叶逆变换

l     观察结果

第一步:读取图像文件数据

新建一个 m 文件,另存为 example21.m,输入以下命令:

[fn, pn] = uigetfile('*.png', '请选择图像文件');

[x, map] = imread(strcat(pn, fn), 'png');

I = rgb2gray(x);

函数原型:A = imread(filename,fmt)

功能:读取 fmt 指定格式的图像文件内容

输入参数:filename 表示图像文件名,字符串 Fmt  表示图像文件格式名,字符串,函数支持的图像格式包括:JPEG,TIFF,GIF,BMP 等等,当参数中不包括文件格式名时,函数尝试推断出文件格式。

返回参数:A 表示图像数据内容,整型 rgb2gray 将 RGB 图像转换为灰度图。

第二步:二维离散傅立叶变换

新建一个 m 文件,另存为 example22.m,输入以下命令:

xf = fft2(I);

xff = fftshift(xf);

fft2 函数对输入参数进行二维离散傅立叶变换并返回其系数,使用 fftshift 将零频对应系数移至中央。

第三步:二维离散傅立叶逆变换

新建一个 m 文件,另存为 example23.m,输入以下命令:

xsync = ifft2(xf);

ifft2 函数对输入参数进行二维离散傅立叶逆变换并返回其系数。

第四步:观察结果

新建一个 m 文件,另存为 example24.m,输入以下命令:

figure;

subplot(2, 2, 1);imshow(x);title('original image');

subplot(2, 2, 2);imshow(uint8(abs(xsync)));title('synthesize image');

subplot(2, 2, 3);mesh(abs(xf));title('fft coef. of image');

subplot(2, 2, 4);mesh(abs(xff));title('fftshift coef. of image');

imshow 是二维数据绘图函数,mesh 通过三维平面显示数据。

用离散余弦变换分析合成音频和图像

分析合成音频文件包括以下步骤:

l     读取音频文件数据

l     一维离散余弦变换

l     一维离散余弦逆变换

l     观察结果

第一步:一维离散余弦变换

新建一个 m 文件,另存为 example31.m,输入以下命令:

xf = dct(x);

dct 函数对输入参数进行一维离散余弦变换并返回其系数,对应频率从 0 到 fs(采样频率)。

第二步:一维离散余弦逆变换

新建一个 m 文件,另存为 example32.m,输入以下命令:

xsync = idct(xf);

[row,col]=size(x);

xff=zeros(row,col);

xff(1:row,1:col)=xf(1:row,1:col);

y=idct(xff);

idct 函数对输入参数进行一维离散余弦逆变换并返回其系数。离散余弦变换常用于图像压缩,可以尝试只使用部分系数重构语言,通过观察可发现,原始音频和合成后音频两者差别不大。

第三步:观察结果

新建一个 m 文件,另存为 example33.m,输入以下命令:

figure;

subplot(2, 2, 1);plot(x);title('original audio');

subplot(2, 2, 2);plot(xsync);title('synthesize audio');

subplot(2, 2, 3);plot(f1, abs(xf));title('fft coef. of audio');

subplot(2, 2, 4);plot(f2(1:len), abs(xff));title('fftshift coef. of auio');

分析合成图像文件包括以下步骤:

l     读取图像文件数据

l     二维离散余弦变换

l     二维离散余弦逆变换

l     观察结果

第一步:二维离散余弦变换

新建一个 m 文件,另存为 example41.m,输入以下命令:

xf = dct2(I);

dct2 函数对输入参数进行二维离散余弦变换并返回其系数。

第二步:二维离散余弦逆变换

新建一个 m 文件,另存为 example42.m,输入以下命令:

xsync = uint8(idct2(xf));

[row, col] = size(I);

lenr = round(row * 4 / 5);

lenc = round(col * 4 / 5);

xff = zeros(row, col);

xff(1:lenr, 1:lenc) = xf(1:lenr, 1:lenc);

y = uint8(idct2(xff));

idct2  函数对输入参数进行二维离散余弦逆变换并返回其系数。可以尝试使用部分系数重构图像,本例中使用了系数矩阵中 4/5 的数据,其它部分置零。为了保证图像能正确显示,使用 uint8 对重构图像原始数据进行了数据类型转换,确保其取值范围在 0 到 255 之间。

第三步:观察结果

请输入命令显示四个子图,分别是原始图像、使用全部系数恢复的图像,使用部分系数恢复的图像和用三维立体图方式显示系数。

新建一个 m 文件,另存为 example43.m,输入以下命令:

figure;

subplot(2, 2, 1);imshow(x);title('original image');

subplot(2, 2, 2);imshow(uint8(abs(xsync)));title('synthesize image');

subplot(2, 2, 3);imshow(uint8(abs(y)));title('part synthesize image');

subplot(2, 2, 4);mesh(abs(xff));title('fftshift coef. of image');

用离散小波变换分析合成音频和图像

分析合成音频文件包括以下步骤:

l     读取音频文件数据

l     一维离散小波变换

l     一维离散小波逆变换

l     观察结果

详细操作步骤为:

第一步:一维离散小波变换

新建一个 m 文件,另存为 example51.m,输入以下命令:

[C, L] = wavedec(x, 2, 'db4');

wavedec 函数对输入参数进行一维离散小波变换并返回其系数 C 和各级系数长度L。第二个参数指明小波变换的级数,第三个参数指明小波变换使用的小波基名称。

第二步:一维离散小波逆变换

新建一个 m 文件,另存为 example52.m,输入以下命令:

xsync = waverec(C, L, 'db4');

cA2 = appcoef(C, L, 'db4', 2);

cD2 = detcoef(C, L, 2);

cD1 = detcoef(C, L, 1);

waverec 函数对输入参数进行一维离散小波逆变换并返回其系数。

appcoef 返回小波系数近似分量,第一个参数 C、第二个参数 L 是 wavedec 的返回参数,为各级小波系数和其长度,第三个参数指明小波基名称,第四个参数指明级。

detcoef 返回小波系数细节分量,第一个参数 C、第二个参数 L 是 wavedec 的返回参数,为各级小波系数和其长度,第三个参数指明级数。

第三步:观察结果

新建一个 m 文件,另存为 example53.m,输入以下命令:

figure;

subplot(2, 3, 1);plot(x);title('original audio');

subplot(2, 3, 2);plot(xsync);title('synthesize audio');

subplot(2, 3, 4);plot(cA2);title('app coef. of audio');

subplot(2, 3, 5);plot(cD2);title('det coef. of auio');

subplot(2, 3, 6);plot(cD1);title('det coef. of auio');

分析合成图像文件包括以下步骤:

l     读取图像文件数据

l     二维离散小波变换

l     二维离散小波逆变换

l     观察结果

第一步:二维离散小波变换

新建一个 m 文件,另存为 example61.m,输入以下命令:

sx = size(I);

[cA1, cH1, cV1, cD1] = dwt2(I, 'bior3.7');

dwt2  函数对输入参数进行二维一级离散小波变换并返回近似分量,水平细节分量,垂直细节分量和对角线细节分量。

如果要对图像进行多级小波分解,使用 wavedec2 函数。

第二步:二维离散小波逆变换

新建一个 m 文件,另存为 example62.m,输入以下命令:

xsync = uint8(idwt2(cA1, cH1, cV1, cD1, 'bior3.7', sx));

A1 = uint8(idwt2(cA1, [], [], [], 'bior3.7', sx));

H1 = uint8(idwt2([], cH1, [], [], 'bior3.7', sx));

V1 = uint8(idwt2([], [], cV1, [], 'bior3.7', sx));

D1 = uint8(idwt2([], [], [], cD1, 'bior3.7', sx));

idwt2 函数对输入参数进行二维离散小波逆变换并返回其系数。可以尝试仅使用近似分量、水平细节分量、垂直细节分量或对角线细节分量重构图像。

第三步:观察结果

输入命令显示六个子图,分别是原始图像、使用全部系数恢复的图像、小波系数近似分量、水平细节分量、垂直细节分量和对角线细节分量。

新建一个 m 文件,另存为 example63.m,输入以下命令:

figure;

subplot(2, 3, 1);imshow(x);title('original image');

subplot(2, 3, 2);imshow(uint8(abs(xsync)));title('synthesize image');

subplot(2, 3, 3);mesh(A1);title('app coef. of image ');

subplot(2, 3, 4);mesh(H1);title('hor coef. of image ');

subplot(2, 3, 5);mesh(V1);title('ver coef. of image ');

subplot(2, 3, 6);mesh(D1);title('dia coef. of image ');

MATLAB之图像与音频信号处理的更多相关文章

  1. DAY13 Matlab实现图像错切源代码

    Matlab实现图像错切源代码 %错切im=(imread('robot.jpg'));im1=rgb2gray(im);figure,imshow(im1);[row,col]=size(im1); ...

  2. matlab 对图像操作的函数概览

    转自博客:http://blog.163.com/fei_lai_feng/blog/static/9289962200991713415422/ 一. 读写图像文件 1. imread imread ...

  3. matlab中的实时音频

    音频系统工具箱™针对实时音频处理进行了优化.audioDeviceReader, audioDeviceWriter, audioPlayerRecorder, dsp.AudioFileReader ...

  4. 【matlab】图像直方图

    使用imhist函数(要先用rgb2gray转化为灰度图像) 利用matlab计算图像直方图函数为imhist() 具体用法: imhist( i );直接显示图像i的灰度直方图: imhist(i, ...

  5. SFML从入门到放弃(2) 图像和音频

    SFML从入门到放弃(2) 图像和音频 精灵 精灵(sf::Sprite)就是截取纹理(sf::Texture)的一块 或者重复纹理贴图 初始化精灵和纹理的一些方法: sf::Sprite init_ ...

  6. MATLAB中图像的基本操作

    MATLAB中图像的基本操作 1.读取.显示图片 MATLAB中提供了immread()与imshow()函数读取和显示图片.其中读取函数imread()原型: imread: A = imread( ...

  7. 使用matlab处理图像的基础知识

    MATLAB基本函数一 矩阵运算 1.基本算数运算(加减乘除) + -运算要求矩阵维数相同,例m*n * /运算,例A=B*C,B矩阵是m*n矩阵,B是n*p矩阵,则A是m*p矩阵 A/B相当于A*i ...

  8. 用matlab给图像加高斯噪声和椒盐噪声(不调用imnoise函数)

    图像画面中的噪声,大致可以分为两类:高斯噪声和椒盐噪声.在这里,我们先看下图像中两种噪声各自的特征. 椒盐噪声:噪声幅值基本相同,但出现位置随机. 高斯噪声:图像中每一点都存在噪声,但幅值是随机分布的 ...

  9. Web开发——HTML基础(图像、音频和视频内容)

    参考: 参考:HTML中的图像 参考:视频和音频内容 目录: 1.HTML中的图像 1.1 我们如何在网页上放置图像? (1)替代文字(alt) (2)宽度和高度 (3)图片标题 1.2 用图形和图形 ...

随机推荐

  1. 给你的SpringBoot做埋点监控--JVM应用度量框架Micrometer

    JVM应用度量框架Micrometer实战 前提 spring-actuator做度量统计收集,使用Prometheus(普罗米修斯)进行数据收集,Grafana(增强ui)进行数据展示,用于监控生成 ...

  2. android 编译突然出错,错误原因 Could not resolve com.tencent.mm.opensdk:wechat-sdk-android-without-mta:+.

    错误追根是因为微信支付依赖的错误 解决办法: 微信支付依赖版本+号改为微信支付依赖最新版本 在这里https://bintray.com/wechat-sdk-team/maven可以查看到wecha ...

  3. SBT安装及命令行打包spark程序

    1.从https://www.scala-sbt.org/download.html官网上寻找所需要的安装包 可以直接本地下载完扔进去也可以wget路径,在这里我用的是sbt1.2.8版本的,下载到/ ...

  4. 安全测试基础2-sqlmap演练

    sqlmap简介 sqlmap是一个开源的渗透测试工具,可以用来进行自动化检测,利用SQL注入漏洞,获取数据库服务器的权限. 它具有功能强大的检测引擎,针对各种不同类型数据库的渗透测试的功能选项,包括 ...

  5. hadoop2.7之作业提交详解(下)

    接着作业提交详解(上)继续写:在上一篇(hadoop2.7之作业提交详解(上))中已经讲到了YARNRunner.submitJob() [WordCount.main() -> Job.wai ...

  6. vscode 支持 threejs 的智能提示

    VSCode Typings and Intellisense: Dummy Learning VS-Code 1 Jun 20, 2016 Updated on Jun 20 2016 for 1. ...

  7. SQL TRUNCATE TABLE 命令

    SQL TRUNCATE TABLE 命令 SQL TRUNCATE TABLE 命令用于删除现有数据表中的所有数据. 你也可以使用 DROP TABLE 命令来删除整个数据表,不过 DROP TAB ...

  8. Ubuntu Server : 自动更新

    Ubuntu(16.04/18.04) 默认会每天自动安装系统的安全更新,但是不会自动安装包的更新.本文梳理 Ubuntu 16.04/18.04 系统的自动更新机制,并介绍如何配置系统自动更新所有的 ...

  9. CF553C Love Triangles(二分图)

    Tyher推的好题. 题意就是给你一些好边一些坏边,其他边随意,让你求符合好坏坏~,或者只包含好好好的三元环的无向图个数. 坏坏的Tyher的题意是这样的. 再翻译得更加透彻一点就是:给你一些0(好边 ...

  10. Flutter学习笔记(21)--TextField文本框组件和Card卡片组件

    如需转载,请注明出处:Flutter学习笔记(21)--TextField文本框组件和Card卡片组件 今天来学习下TextField文本框组件和Card卡片组件. 只要是应用程序就少不了交互,基本上 ...