图像质量评估函数的分类曾是一个比较有争议的话题,在2l世纪以前曾经有过 比较多的讨论.但是随着研究的深入和技术的广泛应用,研究人员对于图像质量 评估函数的分类有了统一的认识,即从实际应用中参考信息供给的角度,将图像质量 评估函数分为以下三种方式: ·全信息评估(full reference) ·盲信息评估(no reference) · 部分信息评估(reduced reference) 其中全信息评估是指参考图像完全清楚时候,即参考目标信息完全清楚的情况 下,对被测图像进行评估方式:盲信息评估…
前言 论文“Deep Boltzmann Machines”是Geoffrey Hinton和他的大牛学生Ruslan Salakhutdinov在论文“Reducing the Dimensionality of Data with Neural Networks”合作后的又一次联合发表的一篇有深远影响的论文,这篇论文第一次提出了DBM及其学习方法,对DBM原理.来源都做了详细讲解. 论文内容 前面介绍的都是BM原理及其训练,可以不用管它,下面直接从第3节开始…… 3.DBM 一般情况下,我们…
图像质量评价(Image Quality Assessment,IQA)是图像处理中的基本技术之一,主要通过对图像进行特性分析研究,然后评估出图像优劣(图像失真程度). 主要的目的是使用合适的评价指标,使得评价结果最符合人类主观评价. 从有没有人参与的角度区分,图像质量评价方法有主观评价和客观评价两个分支. 图像质量主观评价: 主观图像质量的评价方法是以人的主观意识为判断的评价方法,主观评价方法主要可分为两种:绝对评价和相对评价. 绝对评价: 评价指标是平均主观分(MOS),图像质量的绝对评价都…
本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation. 1,概述 当前在闲聊机器人中的主要技术框架都是seq2seq模型.但传统的seq2seq存在很多问题.本文就提出了两个问题: 1)传统的seq2seq模型倾向于生成安全,普适的回答,例如“I don’t know what you are talking about”.为了解决这个问题,作者在更早的一篇文章中提出了用互信息作为模型的目标函数.具体见A Diversi…
论文标题:Faster R-CNN: Down the rabbit hole of modern object detection 论文作者:Zhi Tian , Weilin Huang, Tong He , Pan He , and Yu Qiao 论文地址:https://tryolabs.com/blog/2018/01/18/faster-r-cnn-down-the-rabbit-hole-of-modern-object-detection/ 论文地址:Object detect…
深度强化学习的18个关键问题 from: https://zhuanlan.zhihu.com/p/32153603 85 人赞了该文章 深度强化学习的问题在哪里?未来怎么走?哪些方面可以突破? 这两天我阅读了两篇篇猛文A Brief Survey of Deep Reinforcement Learning 和 Deep Reinforcement Learning: An Overview ,作者排山倒海的引用了200多篇文献,阐述强化学习未来的方向.原文归纳出深度强化学习中的常见科学问题,…
本文转自:http://mp.weixin.qq.com/s/aAHbybdbs_GtY8OyU6h5WA 专题 | 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文) 原创 2017-01-28 Yuxi Li 机器之心 选自arXiv 作者:Yuxi Li 编译:Xavier Massa.侯韵楚.吴攀   摘要 本论文将概述最近在深度强化学习(Deep Reinforcement Learning)方面喜人的进展.本文将从深度学习及强化学习的背景知识开始,包括了对实验平台的…
使用深度学习的超分辨率介绍 关于使用深度学习进行超分辨率的各种组件,损失函数和度量的详细讨论. 介绍 超分辨率是从给定的低分辨率(LR)图像恢复高分辨率(HR)图像的过程.由于较小的空间分辨率(即尺寸)或由于退化的结果(例如模糊),图像可能具有"较低分辨率".我们可以通过以下等式将HR和LR图像联系起来:LR = degradation(HR) 显然,在应用降级函数时,我们从HR图像获得LR图像.但是,我们可以反过来吗?在理想的情况下,是的!如果我们知道确切的降级函数,通过将其逆应用于…
转自https://zhuanlan.zhihu.com/p/25239682 过去的一段时间在深度强化学习领域投入了不少精力,工作中也在应用DRL解决业务问题.子曰:温故而知新,在进一步深入研究和应用DRL前,阶段性的整理下相关知识点.本文集中在DRL的model-free方法的Value-based和Policy-base方法,详细介绍下RL的基本概念和Value-based DQN,Policy-based DDPG两个主要算法,对目前state-of-art的算法(A3C)详细介绍,其他…
目前,深度网络(Deep Nets)权值训练的主流方法还是梯度下降法(结合BP算法),当然在此之前可以用无监督的方法(比如说RBM,Autoencoder)来预训练参数的权值,而梯度下降法应用在深度网络中的一个缺点是权值的迭代变化值会很小,很容易收敛到的局部最优点:另一个缺点是梯度下降法不能很好的处理有病态的曲率(比如Rosenbrock函数)的误差函数.而本文中所介绍的Hessian Free方法(以下简称HF)可以不用预训练网络的权值,效果也还不错,且其适用范围更广(可以用于RNN等网络的学…
Prisma这个应用,你可能很熟悉.这是一个能将不同的绘画风格,迁移到照片中,形成不同艺术风格的图片. 2017年4月,美国康奈尔大学和Adobe的一个研究团队在arvix上通过论文“Deep Photo Style Transfer”, 提出一种叫做“深度摄影风格转换”的演化技术,能将一张照片的风格,迁移到另一张照片中.原论文作者给出了Ubuntu14.04系统下的Torch实现,但是该Torch代码实现需要配置复杂的MATLAB环境,但是浙大的LouieYang将该Torch实现转换成了Te…
2016ICLR最佳论文 Deep Compression: Compression Deep Neural Networks With Pruning, Trained Quantization And Huffman Codin 主要针对神经网络模型巨大,在嵌入式机器中比较难运行的问题. abstruct 压缩网络包括三个阶段:pruning, trained quantization and Huffman coding,能将模型减小1/35~1/49,并且不影响精度.首先 只通过学习重要…
[导读]人工智能顶级会议ICML 2019发布了今年论文录取结果.提交的3424篇论文中,录取了774篇,录取率为22.6%,较去年有所降低.从录取论文数量来看,谷歌成为今年最大赢家,紧随其后的是MIT和伯克利. ICML 2019论文录取结果出炉,你中了吗? 一时间,网友们可高兴坏了,纷纷晒帖表示"我中了!我中了!" 据了解,今年ICML共提交3424篇论文,其中录取774篇,论文录取率为22.6%.录取率较去年ICML 2018的25%有所降低. 目前,所有录取论文已经在官方网站公…
论文提出基于轮廓的实例分割方法Deep snake,轮廓调整是个很不错的方向,引入循环卷积,不仅提升了性能还减少了计算量,保持了实时性,但是Deep snake的大体结构不够优雅,应该还有一些工作可以补,推荐大家阅读   来源:晓飞的算法工程笔记 公众号 论文: Deep Snake for Real-Time Instance Segmentation 论文地址:https://arxiv.org/abs/2001.01629 论文代码:https://github.com/zju3dv/sn…
开始之前 我们在将 opencv 的图像显示在了 qt 的label 上, 我们能够将图显示在label 上, 用于显示我们的算法, 我们在 opencv 上一篇文章中介绍了 opencv 的核操作, 我们这里就要进入一个很重要的章节了,图像滤波操作, 也是图像核操作应用的一个很重要的章节, 那我们就从降噪的角度完整的讲一下, 并通过 opencv 核的方式进行图像算法操作, [技术综述]一文道尽传统图像降噪方法 这篇文章写的还算比较完整, 也是传统的算法的一个综述过程, 目录 目录 开始之前…
基于图嵌入的高斯混合变分自编码器的深度聚类 Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embedding, DGG 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 1. 引言 这篇博文主要是对论文“Deep Clustering by Gaussian Mixture Variational Autoencoders with Graph Embe…
"知物由学"是网易云易盾打造的一个品牌栏目,词语出自汉·王充<论衡·实知>.人,能力有高下之分,学习才知道事物的道理,而后才有智慧,不去求问就不会知道."知物由学"希望通过一篇篇技术干货.趋势解读.人物思考和沉淀给你带来收获的同时,也希望打开你的眼界,成就不一样的你.当然,如果你有不错的认知或分享,也欢迎通过邮件(zhangyong02@corp.netease.com)投稿. 以下是正文: 本文作者:ArturBaćmaga,YND的AI专家. 想象一…
上一篇文章提到了数据挖掘.机器学习.深度学习的区别:http://www.cnblogs.com/charlesblc/p/6159355.html 深度学习具体的内容可以看这里: 参考了这篇文章:https://zhuanlan.zhihu.com/p/20582907?refer=wangchuan  <王川: 深度学习有多深, 学了究竟有几分? (一)> 笔记:神经网络的研究,因为人工智能的一位大牛Marvin Minsky的不看好,并且出书说明其局限性,而出现二十年的长期低潮.   在…
第1页:前言——视频压缩无处不在H.264 或者说 MPEG-4 AVC 是目前使用最广泛的高清视频编码标准,和上一代 MPEG-2.h.263/MPEG-4 Part4 相比,它的压缩率大为提高,例如和 MPEG-2 相比,同样的压缩后画面品质,h.264 的码率通常只需要一半,这意味着存储空间和网络传输时间/带宽大为节省.h.264 是由 ITU-T Study Group 16 (VCEG) 和 ISO/IEC JTC 1 SC 29 / WG 11 (MPEG)这两个组织共同合作制定的,…
1.       对比损失函数(Contrastive Loss function) 孪生架构的目的不是对输入图像进行分类,而是区分它们.因此,分类损失函数(如交叉熵)不是最合适的选择,这种架构更适合使用对比函数.对比损失函数如下: (以判断图片相似度为例)其中Dw被定义为姐妹孪生网络的输出之间的欧氏距离.Y值为1或0.如果模型预测输入是相似的,那么Y的值为0,否则Y为1.m是大于0的边际价值(margin value).有一个边际价值表示超出该边际价值的不同对不会造成损失. Siamese网络…
ssim算法原理 - 我们都不是神的孩子 - CSDN博客 http://blog.csdn.net/ecnu18918079120/article/details/60149864 一.结构相似性(structural similarity)       自然图像具有极高的结构性,表现在图像的像素间存在着很强的相关性,尤其是在空间相似的情况下.这些相关性在视觉场景中携带着关于物体结构的重要信息.我们假设人类视觉系统(HSV)主要从可视区域内获取结构信息.所以通过探测结构信息是否改变来感知图像失…
MSCN系数是无参考的空间域图像质量评估算法BRISQUE(No-Reference Image Quality Assessment in the Spatial Domain)中提出的,MSCN系数具有由于失真的存在而改变的特征统计特性,并且量化这些变化将使得可以预测影响图像的失真类型以及其感知质量.这篇论文的大致原理是从图像中提取MSCN系数,然后将MSCN系数拟合成非对称性广义高斯分布,提取拟合的高斯分布的特征,输入到支持向量机SVM中做回归,最终得到图像质量的评分. 这篇论文提供了源代…
目录 1. 问题本质剖析 2. 方法细节 图像质量评估大佬AC Bovik的论文,发表在2019 TIP上. 考虑的问题:对于有参考图像质量评估(R-IQA)任务,参考图像有时是有损的.这会导致评估的客观质量不合理. 解决思路:简单直接:先用NR-IQA方法评估R的质量,再用R-IQA方法评估相对R的质量,最后结合二者. 作者用的组合方式是简单的相乘.但是作者声称,这样做的性能很好,比其他复杂的组合方式更好? 那么为什么不直接用NR呢?作者解释道,NR方法大多都不理想,至今仍无可商用的NR方法?…
ReLeQ:一种自动强化学习的神经网络深度量化方法     ReLeQ:一种自动强化学习的神经网络深度量化方法ReLeQ: An Automatic Reinforcement Learning Approach for Deep Quantization of Neural Networks 量化作为压缩的一种重要手段被广泛应用,而位宽和准确率的矛盾也始终存在.目前解决的方法有如CLIP-Q中的贝叶斯优化器,确定位宽.另一个问题是量化值的选取,在LQ-Net中采取了交替训练的方式. 如果将量化…
翻译 一项关于视觉特征检测的最新进展概述——http://tongtianta.site/paper/56761 摘要 -特征检测是计算机视觉和图像处理中的基础和重要问题.这是一个低级处理步骤,它是基于计算机视觉的应用程序的基本部分.本文的目的是介绍一项关于视觉特征检测的最新进展和进展的调查.首先,我们从心理学角度描述边缘,角点和斑点之间的关系.其次,我们将检测边缘,角点和斑点的算法分类为不同的类别,并提供每个类别中代表性近期算法的详细描述.考虑到机器学习更多地涉及视觉特征检测,我们更加强调基于…
1.多任务学习导引 多任务学习是机器学习中的一个分支,按1997年综述论文Multi-task Learning一文的定义:Multitask Learning (MTL) is an inductive transfer mechanism whose principle goal is to improve generalization performance. MTL improves generalization by leveraging the domain-specific inf…
Highway Networks 论文地址:arXiv:1505.00387 [cs.LG] (ICML 2015),全文:Training Very Deep Networks( arXiv:1507.06228 ) 基于梯度下降的算法在网络层数增加时训练越来越困难(并非是梯度消失的问题,因为batch norm解决梯度消失问题).论文受 RNN 中的 LSTM.GRU 的 gate 机制的启发,去掉每一层循环的序列输入,去掉 reset gate (不需要遗忘历史信息),仍使用 gate 控…
ITU-R BT.1788建议书 对多媒体应用中视频质量的主观评估方法 (ITU‑R 102/6号研究课题) (2007年) 范围 数字广播系统允许提供多媒体和数据广播应用,包括视频.音频.静态图像.文本和图表.本建议书规定评估多媒体应用视频质量的非交互式主观评估方法. 国际电联无线电通信全会, 考虑到 a)        许多国家正在引入数字广播系统: b)        利用数字广播系统,已经引入或计划引入包括视频.音频.静态图像.文本.图表等的多媒体和数据广播服务: c)        多…
在强化学习(九)Deep Q-Learning进阶之Nature DQN中,我们讨论了Nature DQN的算法流程,它通过使用两个相同的神经网络,以解决数据样本和网络训练之前的相关性.但是还是有其他值得优化的点,文本就关注于Nature DQN的一个改进版本: Double DQN算法(以下简称DDQN). 本章内容主要参考了ICML 2016的deep RL tutorial和DDQN的论文<Deep Reinforcement Learning with Double Q-learning…
AI时代大点兵-国内外知名AI公司2018年最新盘点 导言 据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家.美国占据1078家居首,中国以592家企业排名第二,其后分别是英国,以色列,加拿大等国家.本文中选取了国外和国内部分有代表性的AI产业链条上相关公司就行分析(排名不分先后),希望对有志于从事人工智能相关工作或者想了解AI行业目前发展现状的朋友能有所帮助.小编会从AI芯片.应用层算法.应用领域等方面对相关公司进行盘点,由于部分公司可能会涉及产业链条上不同的领域,文中…