用卷积神经网络对相机位置和角度进行回归.…
详见:http://nbviewer.jupyter.org/github/BVLC/caffe/blob/master/examples/net_surgery.ipynb 假设使用标准的caffe参考ImageNet模型“CaffeNet”,将其转换为一个完全的卷积网络,以实现对大输入的高效.密集的推断.该模型生成一个分类图,它涵盖给定的输入大小,而不是单个分类.例如输入为451*451图片时,使用8*8全卷积分类,(也就是每8*8输出一个),得到了64倍个数的输出结果.时间仅仅用了3倍.通…
Two-Stream Adaptive Graph Convolutional Network for Skeleton-Based Action Recognition 摘要 基于骨架的动作识别因为其以时空结合图(spatiotemporal graph)的形式模拟了人体骨骼而取得了显著的效果. 在现有的基于图的方法中,图的拓扑结构是手动设置的,而且在所有层以及输入样本中是固定不变的.这样的方法在用在有层级CNN和不同输入样本的动作识别中不是最佳的. 而且骨架中的具有更多细节和判别式信息二级结…
创新点: 1.在GCN(global convolutional network)基础上,把他的backbone替换成更多层的,使其适应中分辨率影像,resnet50,101,152 2.利用 channel attention 来挑选出最具有识别力的特征 3.迁移学习来解决数据稀缺的问题,用了不同分辨率训练好的数据 目标数据集: landsat-8 和 ISPRS Vaihingen Challenge Dataset 语义分割现代技术: 1.global context(全局上下文信息):如…
(Learning a Deep Convolutional Network for Image Super-Resolution, ECCV2014) 摘要:我们提出了一种单图像超分辨率的深度学习方法(SR).我们的方法直接学习在低/高分辨率图像之间的端到端映射.这个映射表现为通过一个深度的卷积神经网络CNN,把低分辨率的图像作为输入,输出高分辨率图像.我们进一步证明了基于传统的稀疏编码超分辨的方法也可以看作是一个深卷积网络.但不像传统的方法一样分离的处理每一个组成,我们的方法联合优化了所有层…
论文链接:https://arxiv.org/abs/1811.05320 博客原作者Missouter,博客链接https://www.cnblogs.com/missouter/,欢迎交流. 解读了一下这篇论文github上关于T-GCN的代码,主要分为main文件与TGCN文件两部分,后续有空将会更新其他部分作为baseline代码的解读(鸽). 1.main.py # -*- coding: utf-8 -*- import pickle as pkl import tensorflow…
Deformable conv赋予了CNN位置变换的能力,与普通卷积的对比如下.可以看到,在每个特征点上,会产生一个偏移,变成 不规则的卷积(感觉本质上,就是让CNN自己去学习感受野). 思想来源于STN(Spatial Transform Network),但它们有着巨大的差别: STN得到的是全局(global)的变换,也就是说所得的的变换(旋转.缩放等)都是对整幅图片有效的,因而一幅图片只有一个变换.但许多图片是复杂的, 有多个目标,不同目标的变换方式不同,一个变换包打天下不成.因而出现了…
How to do Deep Learning on Graphs with Graph Convolutional Networks https://towardsdatascience.com/how-to-do-deep-learning-on-graphs-with-graph-convolutional-networks-7d2250723780 scientific internet may need.…
面向领域特定目标的对话系统通常需要建模三种类型的输入,即(i)与领域相关的知识库,(ii)对话的历史(即话语序列)和(iii)需要生成响应的当前话语. 在对这些输入进行建模时,当前最先进的模型(如Mem2Seq)通常会忽略知识图和对话上下文中的句子中固有的丰富结构. 受最近结构感知图卷积成功的启发针对各种NLP任务,如机器翻译.语义角色标记和文档日期,我们提出了一种增强记忆的GCN用于面向目标的对话. 我们的模型利用(i)知识库中的实体关系图和(ii)与话语相关联的依赖图来计算词汇和实体的更丰富…
这篇文章的主要贡献点在于: 1.实验证明仅仅利用图像整体的弱标签很难训练出很好的分割模型: 2.可以利用bounding box来进行训练,并且得到了较好的结果,这样可以代替用pixel-level训练中的ground truth: 3.当我们用少量的pixel-level annotations和大量的图像整体的弱标签来进行半监督学习时,其训练效果可和全部使用pixel-level annotations差不多: 4.利用额外的强弱标签可以进一步提高效果. 这是用image-level lab…
目录 1. 故事 2. 方法 3. 实验 这是继SRCNN(超分辨)之后,作者将CNN的战火又烧到了去压缩失真上.我们看看这篇文章有什么至今仍有启发的故事. 贡献: ARCNN. 讨论了low-level的迁移学习优势. 1. 故事 现有的(传统的)方法要么只关注去除块效应,要么只关注去模糊,没有能兼得的.后果就是这两种操作相互矛盾,去块效应的同时导致模糊,去模糊的同时导致振铃效应. 作者尝试将3层的SRCNN直接用于去除压缩失真,发现效果不好.作者于是在中间增加了一层,美其名曰"feature…
第一步:从前一个隐藏层到后一个隐藏层,对结点进行特征变换 第二步:对第一步进行具体实现 第三步:对邻接矩阵进行归一化(行之和为1) 邻接矩阵A的归一化,可以通过度矩阵D来实现(即通过D^-1*A来实现对A的归一化). 在实践中,使用对称归一化更加有效和有趣.变成下式: 第四步:加入自循环(每个结点从自身出发,又指向自己) 实际上,就是把邻接矩阵对角线上的数,全部由0变为1. 第五步:考虑每个结点与邻结点的关系(一般进行求和运算)  第六步:公式简化 将归一化运算简化一下: 则原式可以变为:  即…
作者认为语义分割的两个挑战是分类和定位,而这两个挑战又是比较对立的.对于分类问题,模型需要有变形和旋转不变形,而对于定位问题,模型有需要对变形敏感. 提出的GCN遵循两个主要原则: 1.对定位问题,模型需要全卷积来获得定位信息,不能有全连接或是全局池化层. 2.对分类问题,需要有大的卷积核来连接特征图和每个像素的分类器 此外还添加了边界精细块(boundary refinement block)来代替传统的CRF后处理 全局卷积时没有用非线性激活函数,只有卷积层 1*k+k*1的效果比 k*k…
从CNN到GCN的联系与区别: https://www.zhihu.com/question/54504471/answer/332657604 更加详解Laplacian矩阵: https://www.zhihu.com/question/54504471/answer/630639025 GCN 实践: https://mp.weixin.qq.com/s/sg9O761F0KHAmCPOfMW_kQ 深度学习时代的图模型,图网络综述: https://mp.weixin.qq.com/s/…
Introduction 该文章首次采用深度学习方法来解决基于视频的行人重识别,创新点:提出了一个新的循环神经网络架构(recurrent DNN architecture),通过使用Siamese网络(孪生神经网络),并结合了递归与外貌数据的时间池,来学习每个行人视频序列的特征表示. Method (1)特征提取架构: 第一层:卷积神经网络,提取每个行人的外貌特征向量: 第二层:循环神经网络,让网络更好的提取时空信息: 第三层:时间池,让网络将不同长度的视频序列总结为一个特征向量. Siame…
为给之后关于图卷积网络的科研做知识积累,这里写一篇关于GCN基本理解的博客.GCN的本质是一个图网络中,特征信息的交互+与传播.这里的图指的不是图片,而是数据结构中的图,图卷积网络的应用非常广泛 ,经常被举到的典型例子就是一个空间中热量的传递和交互,这里不多作赘述. 一.图卷积网络与普通卷积网络的应用范围 图卷积网络为什么叫图卷积网络呢?图卷积网络,其实就是就是GCN,但GCN为什么是图神经网络呢?小编也很疑惑. 好了!开玩笑的话先打住,进入正题.首先复习一下卷积神经网络的工作原理,以检测图片的…
论文链接:https://arxiv.org/abs/1811.05320 最近发现博客好像会被CSDN和一些奇怪的野鸡网站爬下来?看见有人跟爬虫机器人单方面讨论问题我也蛮无奈的.总之原作者Missouter,博客链接https://www.cnblogs.com/missouter/,欢迎交流. 整理.精炼了一下这篇论文的思路. Abstract: 交通预测的难点在于交通拓扑网络复杂的结构与随时间动态发生的交通变化:为了提取交通网的空间与时间特征,文章提出了一种时间性的图卷积网络模型,结合了门…
      ICCV 2015:21篇最火爆研究论文 ICCV 2015: Twenty one hottest research papers   “Geometry vs Recognition” becomes ConvNet-for-X Computer Vision used to be cleanly separated into two schools: geometry and recognition. Geometric methods like structure from…
博客转载自:https://blog.csdn.net/u010821666/article/details/78793225 原文标题:深度学习结合SLAM的研究思路/成果整理之 1. 深度学习跟SLAM的结合点 深度学习和slam的结合是近几年比较热的一个研究方向,具体的研究方向,我简单分为三块,如下. 1.1 深度学习结合SLAM的三个方向 用深度学习方法替换传统SLAM中的一个/几个模块 特征提取,特征匹配,提高特征点稳定性,提取点线面等不同层级的特征点. 深度估计 位姿估计 重定位 其…
Autonomous_Vehicle_Paper_Reading_List 2018-07-19 10:40:08 Reference:https://github.com/ZRZheng/Autonomous_Vehicle_Paper_Reading_List A collection of papers focus on self-driving car. Many topics are covered including system architecture,computer viso…
目录 Q1:CNN 中的全连接层为什么可以看作是使用卷积核遍历整个输入区域的卷积操作? Q2:1×1 的卷积核(filter)怎么理解? Q3:什么是感受野(Receptive field)? Q4:对含有全连接层的 CNN,输入图像的大小必须固定? Q5:什么是 Global Average Pooling(GAP)? Q6:什么是 depthwise separable convolution?Depthwise convolution 和 pointwise convolution 分别又…
ImageNet Classification with Deep Convolutional Neural Network 利用深度卷积神经网络进行ImageNet分类 Abstract We trained a large, deep convolutional neural network to classify the 1.2 million high-resolution images in the ImageNet LSVRC-2010 contest into the 1000 d…
论文原址:https://arxiv.org/abs/1904.01355 github: tinyurl.com/FCOSv1 摘要 本文提出了一个基于全卷积的单阶段检测网络,类似于语义分割,针对每个像素进行预测.RetinaNet,SSD,YOLOv3,Faster R-CNN都依赖于预定义的anchor boxes.本文的FCOX是anchor free ,proposal free类型的检测器.将预定义的anchors进行移除,进而减少了大量的计算以及内存占用,同时,anchor中的超参…
转自:http://www.asimovinstitute.org/neural-network-zoo/ THE NEURAL NETWORK ZOO POSTED ON SEPTEMBER 14, 2016 BY FJODOR VAN VEEN   With new neural network architectures popping up every now and then, it's hard to keep track of them all. Knowing all the a…
摘要 卷积网络在特征分层领域是非常强大的视觉模型.我们证明了经过端到端.像素到像素训练的卷积网络超过语义分割中最先进的技术.我们的核心观点是建立"全卷积"网络,输入任意尺寸,经过有效的推理和学习产生相应尺寸的输出.我们定义并指定全卷积网络的空间,解释它们在空间范围内dense prediction任务(预测每个像素所属的类别)和获取与先验模型联系的应用.我们改编当前的分类网络(AlexNet [22] ,the VGG net [34] , and GoogLeNet [35] )到完…
This past summer I interned at Flipboard in Palo Alto, California. I worked on machine learning based problems, one of which was Image Upscaling. This post will show some preliminary results, discuss our model and its possible applications to Flipboa…
CNN 主要解决 computer vision 问题,同时解决input X 维度太大的问题. Edge detection 下面演示了convolution 的概念 下图的 vertical edge 看起来有点厚,但是如果图片远比6x6像素大的话,就会看到效果非常不错. 除了前面讲过的第一种filter, 还有两种 (Sobel filter, Scharr filter) 接下来会讲到 CNN 的两个重要的buiding block - padding, strided convolut…
CNN很多概述和要点在CS231n.Neural Networks and Deep Learning中有详细阐述,这里补充Deep Learning Tutorial中的内容.本节前提是前两节的内容,因为要用到全连接层.logistic regression层等.关于Theano:掌握共享变量,下采样,conv2d,dimshuffle的应用等. 1.卷积操作 在Theano中,ConvOp是提供卷积操作的主力.ConvOp来自theano.tensor.signal.conv.conv2d,…
Deep Learning & Art: Neural Style Transfer Welcome to the second assignment of this week. In this assignment, you will learn about Neural Style Transfer. This algorithm was created by Gatys et al. (2015) (https://arxiv.org/abs/1508.06576). In this as…
Convolutional Neural Networks: Step by Step Welcome to Course 4's first assignment! In this assignment, you will implement convolutional (CONV) and pooling (POOL) layers in numpy, including both forward propagation and (optionally) backward propagati…