用于多视角人群计数的协同通信图卷积网络 Co-Communication Graph Convolutional Network for Multi-View Crowd Counting
Multi-Camara Methods
Co-Communication Graph Convolutional Network for Multi-View Crowd Counting
论文url https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9860092
针对问题
以往方法利用多视角图像特征像素级匹配,匹配关系估计亲和矩阵,错误匹配会导致估计结果不准确
方法

将每个摄像机试图投射到一个图中,节点为Vi,边为Ei,用于捕捉视图内的上下文依赖关系和视图间的互补关系
输入:
- 多摄像头视角数据集,模型输入是一组来自多个摄像机视角的图像,记作
{l1, l2, ..., ln}。
- 多摄像头视角数据集,模型输入是一组来自多个摄像机视角的图像,记作
输出:
- 场景级密度图,模型的输出是一个场景级密度图(D),该密度图表示整个监控区域的估计人流量。该密度图是通过融合所有视角的信息得到的,并且可以从中计算出总人数。
单视角特征提取层:
- 使用全卷积网络(例如截断的VGG网络)从每个输入图像中提取特征,得到一组初始单视角表示
{f1, f2, ..., fn}。
- 使用全卷积网络(例如截断的VGG网络)从每个输入图像中提取特征,得到一组初始单视角表示
图构建层:
- 对于每个特征图 fi,使用聚类方法将其投影到一个图 Gi = (Vi, Ei) 上,其中 Vi 是节点集合,Ei 是边集合,表示特征向量之间的相关性。
图通信层(GCL):
- 通过建立图之间的显式链接来编码跨视角的互补信息。这一层使用匹配函数(如余弦相似性)和消息传递函数来更新每个图的节点表示。
图卷积层(GCN):
- 对每个更新后的图表示进行图卷积操作,以捕获单视角内的上下文依赖性。这一层使用标准的图卷积网络来实现。
图重投影层:
- 将图卷积层输出的节点表示重新投影回原始特征图的坐标空间,以增强特征表示。这通常通过注意力机制实现。
共记忆层(CoML):
- 这一层通过层次化图池化过程来学习每个单视角图的层次化表示。它使用共享的键值记忆机制来粗化图,并生成一系列层次化的图表示。
宽区域表示学习层:
- 这一层将多视角特征映射到场景级坐标空间,并使用融合函数(例如连接层后跟1x1卷积层)来产生最终的场景级表示。
分类器:
- 最后,使用一个可学习的分类器(通常是1x1卷积层)将场景级表示映射到相应的密度图 D,通过求和所有值来计算总人数。
效果图

后记
时隔一两年,重新启动这个blog,发现很多图片都挂掉了,实在影响阅览体验,抱歉。但是莫名有一种隔了多年返乡打扫自家已经长满杂草的院子的感觉。(图片全部都换新了,如果有什么觉得不太合适的地方可以留言我都会查看的)
今天开始打算在这个上面记录一些论文学习以及一些代码学习的内容,虽然这个模板页面不太利于浏览,浏览方式也不太完美,但是我毕竟不是搞前端的,并且平时也没有多余时间去弄前端了吧,所以就不打算修改了,能用就行。
最近因为工作要阅读大量的multi-camara learning相关的技术,故在此记录,但是这篇是基于图神经网络的网络模型,我不是很熟悉,并且暂不打算学习图神经网络,该篇浏览速度较快,对相应技术理解可能有一些不到位的地方,可能后续学习图神经网络的时候会回来纠正,也欢迎留言指正修改,谢谢。
用于多视角人群计数的协同通信图卷积网络 Co-Communication Graph Convolutional Network for Multi-View Crowd Counting的更多相关文章
- 最全面的图卷积网络GCN的理解和详细推导,都在这里了!
目录 目录 1. 为什么会出现图卷积神经网络? 2. 图卷积网络的两种理解方式 2.1 vertex domain(spatial domain):顶点域(空间域) 2.2 spectral doma ...
- 【GCN】图卷积网络初探——基于图(Graph)的傅里叶变换和卷积
[GCN]图卷积网络初探——基于图(Graph)的傅里叶变换和卷积 2018年11月29日 11:50:38 夏至夏至520 阅读数 5980更多 分类专栏: # MachineLearning ...
- 论文解读丨基于局部特征保留的图卷积神经网络架构(LPD-GCN)
摘要:本文提出一种基于局部特征保留的图卷积网络架构,与最新的对比算法相比,该方法在多个数据集上的图分类性能得到大幅度提升,泛化性能也得到了改善. 本文分享自华为云社区<论文解读:基于局部特征保留 ...
- 图卷积神经网络(GCN)入门
图卷积网络Graph Convolutional Nueral Network,简称GCN,最近两年大热,取得不少进展.不得不专门为GCN开一个新篇章,表示其重要程度.本文结合大量参考文献,从理论到实 ...
- Graph Neural Networks:谱域图卷积
以下学习内容参考了:1,2, 0.首先回忆CNN,卷积神经网络的结构和特点 处理的数据特征:具有规则的空间结构(Euclidean domains),都可以采用一维或者二维的矩阵描述.(Convolu ...
- 图卷积神经网络分类的pytorch实现
图神经网络(GNN)目前的主流实现方式就是节点之间的信息汇聚,也就是类似于卷积网络的邻域加权和,比如图卷积网络(GCN).图注意力网络(GAT)等.下面根据GCN的实现原理使用Pytorch张量,和调 ...
- Python2.7+virtualenv+CUDA 10.0版的pytorch v1.3.0 +运行人群计数crowdcount-mcnn网络
Python2.7$ python2 -m virtualenv pytorchenv$ source pytorchenv/bin/activate $ pip install ipython py ...
- Convolution Network及其变种(反卷积、扩展卷积、因果卷积、图卷积)
今天,主要和大家分享一下最近研究的卷积网络和它的一些变种. 首先,介绍一下基础的卷积网络. 通过PPT上的这个经典的动态图片可以很好的理解卷积的过程.图中蓝色的大矩阵是我们的输入,黄色的小矩阵是卷积核 ...
- 译:Local Spectral Graph Convolution for Point Set Feature Learning-用于点集特征学习的局部谱图卷积
标题:Local Spectral Graph Convolution for Point Set Feature Learning 作者:Chu Wang, Babak Samari, Kaleem ...
- ACNet:用于图像超分的非对称卷积网络
编辑:Happy 首发:AIWalker Paper:https://arxiv.org/abs/2103.13634 Code:https://github.com/hellloxiaotian/A ...
随机推荐
- 【Azure 应用服务】查看App Service for Linux上部署PHP 7.4 和 8.0时,所使用的WEB服务器是什么?
问题描述 如何查看PHP应用部署到App Service后,Azure上面使用的应用服务器是什么呢?因为App Service支持两种操作系统,Windows 和 Linux.在Windows中,使用 ...
- Linux操作系统不同文件类型区别?
蓝色代表目录,绿色代表可执行文件,红色代表压缩文件.浅蓝色表示连接文件.白色表示其他文件 相关目录及作用: Bin : 存放普通用户可执行的指令 Boot: 开机引导目录 Dev:设备目录 Etc: ...
- sentinel的见解
Sentinel 是面向分布式.多语言异构化服务架构的流量治理组件,主要以流量为切入点,从流量控制.熔断降级.热点流量防护等多个维度来帮助开发者保障微服务的稳定性. 在 Sentinel 里面,所 ...
- linux下,使用nginx实现动静分离,访问图片报404
一.需求描述 最近在开发一个微信小程序,由于微信小程序端代码包总大小限定在三四兆,所以有很多的图标资源就不能放在微信小程序中进行打包, 否则会超过微信的限制而无法打包.自己能够想到的最简单的办法就是将 ...
- 数据湖&湖仓一体简介
1 简介 术语 数据库 数据库是"按照数据结构来组织.存储和管理数据的仓库". 广义上的数据库,在20世纪60年代已经在计算机中应用了.但这个阶段的数据库结构主要是层次或网状的,且 ...
- spring boot 自动装载对象为null问题的解决
情况描述 有个Server类,成员变量是spring中自动管理的bean类对象 public class Server { @Autowired private CommandMapper comma ...
- 中国十大热门网站榜中榜/Alexa综合排名TOP10(2015)
互联网企业是由网络为基础的经营,一般包括IT行业.电子商务.软件开发等. 商业时代催生网络时代兴起,互联网以其强大的信息存储.信息互通.信息处理等功能,风靡全世界,无处无有,轻松一点,信息就在你面前. ...
- 【个人笔记】Nestjs使用TypeORM注意点
在Nestjs使用TypeORM还是有一些注意点. entities路径配置注意点 在nestjs中使用TypeORM,需要配置数据库连接(以MySQL为例).需要特别注意的是配置参数里面的entit ...
- 2022亚洲视博会圆满落幕,3DCAT荣获“优秀沉浸式视觉解决方案”奖
2022年8月10-12日,为期3天的2022世界元宇宙生态博览会暨VR/AR/MR/XR.数字创意.数字展陈.数字文旅.数字运动.数字艺术与沉浸式空间场景设计展览会圆满落下帷幕! 此次展会共包含三大 ...
- Deeplink实践原理分析
目录介绍 01.先看一个场景 02.什么是DeepLink 03.什么是Deferred DeepLink 04.什么是AppLink 05.DeepLink和AppLink核心技术 06.DeepL ...