这一篇应该是继《BLIND QUALITY ASSESSMENT OF COMPRESSED IMAGES VIA PSEUDO STRUCTURAL SIMILARITY》(2016 ICME)之后的拓展工作。后者是将压缩图像再压缩,比较二者伪结构(压缩块角)的相似度;而本文就是将方法一般化,产生了伪参考图像的概念。

建议先看那篇短文,再看本文。本文只记录扩展部分的精华。

【实际上,这种思想并不是作者的首创。在去模糊等领域,这种思想被广泛使用[5,6]】

本文称伪参考图像为pseudo-reference image(PRI),基于PRI的盲IQA方法为PRI-based BIQA。

本文考虑三种失真:块效应,模糊和噪声。

1. 技术细节

要注意的是,每一种失真很不一样,因此我们需要设计distortion-specific PRI以及对应的测距方法。

对于块效应,我们先对压缩图像进一步强压缩,然后寻找各自的伪结构,最后计算二者伪结构的相似度(PSS),即最终得分。

对于模糊和噪声,它们都会改变图像的局部结构:平坦区域可能因为噪声变得有纹理,而纹理区域可能因为模糊变得平滑。因此我们测量的是局部结构相似度(local structure similarity, LSS)。具体是借助local binary pattern(LBP)[8]来刻画局部结构。

1.1 失真识别

借助DIIVINE[7]的识别方法。只有此步需要训练。

1.2 得到对应的PRI并评估质量

块效应

我们先说块效应。流程与ICME大致相同,不同点:

  1. 计算PSS时分母上加1,以保证数值稳定性。

  2. 检测角使用MATLAB的最小特征值法[43]。质量阈值很小,设为0.001。

  3. 在处理图像前,先用\(3 \times 3\)标准差为0.5的高斯滤波器滤波。

模糊和噪声

我们再说模糊和噪声指标——LSS。

模糊图像和有噪图像的PRI分别是:

得到PRI以后,我们要用LBP来表征PRI和原图各自的局部结构。LBP记录的是某个像素和其圆形邻域内像素的亮度值的差值,并且以二值化形式编码记录:

得到LBP之后,我们再处理一步:

上面是对模糊LBP的处理,下面是对有噪LBP的处理。

最后,我们遵循与块效应相同的步骤,计算相似度即可。

效果:

质量越差(DMOS小),重合越多(白色区域占比大),得分越高(LSS得分高)。

1.3 扩展为通用的质量评价指标——BPRI

有上面那些是不够的。如果一张图像里存在多种失真耦合,那么以上流程和指标都没法用。为此,我们将方法拓展。

归一化3种质量评分

首先,我们要让PSS和两个LSS处于相近的区间,即归一化。方法就是用100张图像(4种失真类型和5种失真尺度,共2000张),拟合各自的模型:
\[
q' = \lambda_1 (\frac{1}{2} - \frac{1}{1 + \exp \lambda_2 (q - \lambda_3)}) + \lambda_4 q + \lambda_5
\]

这样,3个得分都会在0和1之间波动。拟合对象为FR方法GMSD[49]。

判断失真类型

这里作者使用了SVM作为分类器。输入即3个归一化前的质量评分组成的1个3维向量,输出也是3维向量,表征3种失真的概率。

加权求和

概率和归一化后的得分加权求和,即最终得分。

实验略。

2. 总结

优点:

We solve the problem of IQA by measuring "how much worse the image could be?" rather than the traditional "how bad the image is?".

缺点:

  1. 存在大量手工设计的参数。调起来甚是麻烦。

  2. 很难处理耦合失真。

  3. 失真类型有限。每加入一种失真类型,就需要训练一个SVM,拟合一个归一化模型,定义一个PRI。

Paper | Blind Quality Assessment Based on Pseudo-Reference Image的更多相关文章

  1. Paper | BLIND QUALITY ASSESSMENT OF COMPRESSED IMAGES VIA PSEUDO STRUCTURAL SIMILARITY

    目录 1. 技术细节 1.1 得到MDI 1.2 判别伪结构,计算伪结构相似性 2. 实验 动机:作者认为,基于块的压缩会产生一种伪结构(pseudo structures),并且不同程度压缩产生的伪 ...

  2. Paper | No-reference Quality Assessment of Deblocked Images

    目录 故事背景 本文方法(DBIQ) 发表在2016年Neurocomputing. 摘要 JPEG is the most commonly used image compression stand ...

  3. [论文笔记] Methodologies for Data Quality Assessment and Improvement (ACM Comput.Surv, 2009) (1)

    Carlo Batini, Cinzia Cappiello, Chiara Francalanci, and Andrea Maurino. 2009. Methodologies for data ...

  4. Troubleshooting routing topology based on a reference topology

    In one embodiment, a computing device (e.g., border router or network management server) transmits a ...

  5. Paper | Quality assessment of deblocked images

    目录 1. 故事 2. 失真变化 3. 方法(PSNR-B) 4. 实验 这篇文章提出了一个PSNR-B指标,旨在衡量 压缩图像的块效应强度 或 去块效应后的残留块效应强度(比较去块效应算法的优劣). ...

  6. [论文笔记] Methodologies for Data Quality Assessment and Improvement (ACM Comput.Surv, 2009) (2)

    本篇博文主要对DMQ(S3.7)的分类进行了研读. 1. 这个章节提出了一种DQM的分类法(如下图) 由上图可见,该分类法的分类标准是对assessment & improvement阶段的支 ...

  7. Quality assessment and quality control of NGS data

    http://www.molecularevolution.org/resources/activities/QC_of_NGS_data_activity_new table of contents ...

  8. Paper | D3: Deep Dual-Domain Based Fast Restoration of JPEG-Compressed Images

    目录 摘要 读后感 故事 深度双域法(D3) 发表于2016年CVPR. 摘要 既利用了CNN,又考虑了JPEG压缩的特性,解决JPEG图像去失真问题. 针对于压缩特性,作者考虑了JPEG压缩方案的先 ...

  9. {Reship}{Code}{CV}

    UIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下: https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/in ...

随机推荐

  1. JavaScript 代码执行顺序

    一.先预处理后执行 在一个JavaScript文件或一个JavaScript代码块的内部,浏览器会先对代码进行预处理(编译),然后再执行. 预处理会跳过执行语句,只处理声明语句,同样也是按从上到下按顺 ...

  2. HTML页面导入模板页面(Tomcat)

    找了个前端模板,多个HTML中有重复的部分,一改都改,所以对其进行重构,将重复的部分拿出来 看了很多方法,最简单的是jQuery,但是在我这没起作用,后来发现一个配置tomcat的ssi,让服务器帮我 ...

  3. ubuntu升级pip报cannot import name 'main'解决方法

    执行sudo vi /usr/bin/pip 将代码: from pip import main if __name__ == '__main__': sys.exit(main()) 修改为: fr ...

  4. Codeforces Round #598 (Div. 3) E. Yet Another Division Into Teams dp

    E. Yet Another Division Into Teams There are n students at your university. The programming skill of ...

  5. CF1254D Tree Queries(树链剖分)

    出题人的做法是 \(O(n\sqrt{n\log n})\),结果这场结束后就被狂喷,一群人给出了 \(O(n\sqrt{n})\) 做法,甚至 \(O(n\log n)\) 都出来了-- 首先发现, ...

  6. OpenFOAM——过渡管中的湍流

    本算例来自<ANSYS Fluid Dynamics Verification Manual>中的VMFL016:Turbulent Flow in a Transition Duct 一 ...

  7. Global Azure Bootcamp 2019 宁波站活动总结

    4月27日,由微软MVP技术社区发起的Global Azure Bootcamp 2019盛会在全球80多个国家270个城市举办.本次活动由全国众多Azure专家及微软MVP技术社区成员,分别在北京. ...

  8. RMAN详细教程(三):备份脚本的组件和注释

    RMAN详细教程(一):基本命令代码 RMAN详细教程(二):备份.检查.维护.恢复 RMAN详细教程(三):备份脚本的组件和注释 RMAN详细教程(四):备份脚本实战操作 一.基本组件: 1.Ser ...

  9. IT兄弟连 HTML5教程 HTML语言的语法 1

    HTML是文本类型的语言,和其他任何一门语言相比,语法都是最简单的.但在编写HTML文件时,必须遵循HTML的语法规则.一个完整的HTML文件由标题.段落.列表.表格.文本,即嵌入的各种对象所组成,这 ...

  10. 支付签名 MD5Util 排序工具类

    package com.skynet.wechat.wxPay.common; import java.security.MessageDigest; import java.util.Iterato ...