SSIM(结构相似度算法)不同实现版本的差异
前言
最近用ssim测试图片画质损伤时,发现matlab自带ssim与之前一直使用的ssim计算得分有差异,故和同事开始确定差异所在。
不同的SSIM版本
这里提到不同的ssim版本主要基于matlab。如前言所述,主要分为2个实现。
- 版本1:Zhou Wang实现的版本(也是我之前一直用的版本),具体见:
滑铁卢大学:https://ece.uwaterloo.ca/~z70wang/research/ssim/
纽约大学:http://www.cns.nyu.edu/~lcv/ssim/ - 版本2:matlab2015-ssim(matlab从2014开始加入了ssim)
2个版本的差异
虽然2个版本的代码实现完全不一样,但总的说,差异可以归结为以下几点:
1. downsample
- Zhou Wang实现版本有downsample,他也推荐这么做,原因如下:
The precisely right scale depends on both the image resolution and the viewing distance and is usually difficult to be obtained. In practice, we suggest to use the following empirical formula to determine the scale for images viewed from a typical distance (say 3~5 times of the image height or width): 1) Let F = max(1, round(N/256)), where N is the number of pixels in image height (or width); 2) Average local F by F pixels and then downsample the image by a factor of F; and 3) apply the ssim_index.m program. For example, for an 512 by 512 image, F = max(1, round(512/256)) = 2, so the image should be averaged within a 2 by 2 window and downsampled by a factor of 2 before applying ssim_index.m.
上面这段意思:人看图片时,与图片有一定距离(相当于图片缩小),一些细节可被忽略,如果进行downsample,除了减低运算复杂度,还能更贴合人的主观观看感受。
涉及downsample的代码部分:
% automatic downsampling
f = max(1,round(min(M,N)/256)); %downsampling by f
%use a simple low-pass filter
if(f>1)
lpf = ones(f,f);
lpf = lpf/sum(lpf(:));
img1 = imfilter(img1,lpf,'symmetric','same');
img2 = imfilter(img2,lpf,'symmetric','same');
img1 = img1(1:f:end,1:f:end);
img2 = img2(1:f:end,1:f:end);
end
由于Zhou Wang版ssim对比时,原图与失真图都做了downsample(缩小),其产生的影响是:
- downsample后的相似度 比 不做downsample的相似度 要高;
- 损失程度不同2张失真图,在downsample后进行ssim,2者相似度差距减少;
downsample是导致 Zhou Wang版本 与 matlab官方版本 计算结果相差较大的主要原因。 而大学官网上其实也提供了Zhou Wang实现的非downsample版本,只不过名字是: ssim_index.m。
2. 滤波部分
- Zhou Wang版本去掉downsample后,和matlab官方的结果还有约±0.002差距,其原因主要是滤波部分存在差异。
- 滤波参数:
- 输入矩阵(图像)
- 这个是我们传入的,不存差异;
- 滤波掩模
Zhou Wang版本
代码:
- 输入矩阵(图像)
- 滤波参数:
window = fspecial('gaussian', 11, 1.5);
% 算子类型:gaussian(高斯)
% 模版尺寸:11*11
% 标准差:1.5
% 以上参数皆hardcode
```
- matlab版本
代码:
```js
filtRadius = ceil(radius3);
filtSize = 2filtRadius + 1;
if (N < 3)
gaussFilt = fspecial('gaussian',[filtSize filtSize],radius); % 2D mask
else
...% 3D mask
end
% 算子类型:gaussian(高斯)
% 模版尺寸:[filtSize filtSize],使用默认值计算后,为:11*11矩阵;
% 标准差:radius,默认值为:1.5;
% 以上参数皆可通过传参改变
```
- <font color=#FF4500>**滤波模式**</font>
- Zhou Wang版本:
使用互相关(correlation)
- matlab版本:
使用卷积(convolution)
- <font color=#FF4500>**边界填充方式**</font>
- Zhou Wang版本:
边界通过填充0来扩展,例如:

- matlab版本:
通过复制外边界的值来扩展,例如:

- <font color=#FF4500>**结果矩阵**</font>
- Zhou Wang版本
只返回滤波时未使用边缘补 0 部分进行计算的结果部分(返回矩阵小于输入矩阵),例如:

- matlab版本
与输入矩阵大小一致,例如:

由于以上差异,<font color=#FF4500>导致了 Zhou Wang版ssim 与 matlab官方ssim 在计算结果上存在轻微差距</font>。
3. 2D与3D图片支持
- matlab官方的ssim,除了支持2D图片,外还支持3D图片;而Zhou Wang版本只支持2D图片。
- 2D图片
ssim只支持对2D灰度图进行结构相似度计算,rgb图(彩图)需转换为灰度图才能计算(可调用rgb2gray进行转换)。 - 3D图片
3D图片现在在医疗领域用得较多:

在matlab2015中,如果直接读入rgb图(不转换为灰度)会被认为是3D图,这个比较坑爹,ssim运行不报错,但结果却是完全错的。
SSIM(结构相似度算法)不同实现版本的差异的更多相关文章
- 文本相似度算法——空间向量模型的余弦算法和TF-IDF
1.信息检索中的重要发明TF-IDF TF-IDF是一种统计方法,TF-IDF的主要思想是,如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分 ...
- 文本相似度 余弦值相似度算法 VS L氏编辑距离(动态规划)
设置n为字符串s的长度.("我是个小仙女") 设置m为字符串t的长度.("我不是个小仙女") 如果n等于0,返回m并退出.如果m等于0,返回n并退出.构造两个向 ...
- python结巴分词余弦相似度算法实现
过余弦相似度算法计算两个字符串之间的相关度,来对关键词进行归类.重写标题.文章伪原创等功能, 让你目瞪口呆.以下案例使用的母词文件均为txt文件,两种格式:一种内容是纯关键词的txt,每行一个关键词就 ...
- "如何用70行Java代码实现深度神经网络算法" 的delphi版本
http://blog.csdn.net/hustjoyboy/article/details/50721535 "如何用70行Java代码实现深度神经网络算法" 的delphi ...
- Spark/Scala实现推荐系统中的相似度算法(欧几里得距离、皮尔逊相关系数、余弦相似度:附实现代码)
在推荐系统中,协同过滤算法是应用较多的,具体又主要划分为基于用户和基于物品的协同过滤算法,核心点就是基于"一个人"或"一件物品",根据这个人或物品所具有的属性, ...
- elasticsearch算法之词项相似度算法(一)
一.词项相似度 elasticsearch支持拼写纠错,其建议词的获取就需要进行词项相似度的计算:今天我们来通过不同的距离算法来学习一下词项相似度算法: 二.数据准备 计算词项相似度,就需要首先将词项 ...
- 10. 选主算法、多版本兼容性及滚动升级 | 深入浅出MGR
GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. 目录 1. 选主算法 2. 多版本兼容性 3. MGR 5.7滚动升级至8.0 4. 小结 参考资料.文档 免责声明 文章 ...
- git日志输出格式及两个版本之间差异列表
查看commit id git log --pretty=format:"%h" git log --pretty=format:"%H" 获取两个版本间差异的 ...
- Android USER 版本与ENG 版本的差异--MTK官方解释
分类: Android(4) Description]Android USER 版本与ENG 版本的差异 [Keyword]USER ENG user eng 用户版本 工程版本 差异 [Solu ...
随机推荐
- 《Android进阶》之第四篇 ViewPagerIndicator的使用
1.先将这个开源框架下载到本地: Administrator@QH-20141231RFQJ /d/hixin $ cd ViewPagerIndicator/ Administrator@QH-20 ...
- Nodejs基础:stream模块入门介绍与使用
本文摘录自<Nodejs学习笔记>,更多章节及更新,请访问 github主页地址.欢迎加群交流,群号 197339705. 模块概览 nodejs的核心模块,基本上都是stream的的实例 ...
- MSICE界面和功能分析
一.首页 ICE实现的这种界面样式,有可能使用WCF实现的,但是MFC来模仿也是可行的. 包括配置界面,和右下角的细节. 首页的主要功能只有3个,分别为图片拼接.视频拼接和打开拼接文件. 二.输入拼接 ...
- 如何通过 WebP 兼容减少图片资源大小
作者:学军又拍云 CDN 服务公测 WebP 自适应功能,为客户减少图片资源大小.本文我们将一起来阐述WebP兼容的来龙去脉. 前言我们知道,理想的网页应该在 1 秒内打开,而在页面的整体大小中,图片 ...
- Flume简介及安装
Hadoop业务的大致开发流程以及Flume在业务中的地位: 从Hadoop的业务开发流程图中可以看出,在大数据的业务处理过程中,对于数据的采集是十分重要的一步,也是不可避免的一步,从而引出我们本文的 ...
- TextView 实现跑马灯效果
在String.xml中添加: <string name="txt">跑马灯效果,我跑啊跑</string>在layout/mian.xml中添加TextV ...
- 从LINQ开始之LINQ to Objects(下)
前言 上一篇<从LINQ开始之LINQ to Objects(上)>主要介绍了LINQ的体系结构.基本语法以及LINQ to Objects中标准查询操作符的使用方法. 本篇则主要讨论LI ...
- Windows 修改电脑属性(一)
修改电脑属性里的注册信息 修改电脑属性的注册信息 运行注册表的方法:开始→运行→regedit→确定 1.CPU型号可以注册表编辑器中定位到下面的位置: HKEY_LOCAL_MACHINE\HARD ...
- 02-2--数据库MySQL:DDL(Data Definition Language:数据库定义语言)操作数据库中的表(二)
DDL对数据库的操作:http://blog.csdn.net/baidu_37107022/article/details/72334560 DDL对数据库中表的操作 1)方法概览 2)演示 //创 ...
- lucene全文搜索之一:lucene的主要功能和基本结构(基于lucene5.5.3)
前言:lucene并不是像solr或elastic那样提供现成的.直接部署可用的系统,而是一套jar包,提供了一些常见语言分词.构建索引和创建搜索器等等功能的API,我们常用到的也就是分词器.索引目录 ...