Host–Parasite(主从关系): Graph LSTM-in-LSTM for Group Activity Recognition
This article aims to tackle the problem of group activity recognition in the multiple-person scene.
1)以往模型忽略:most long short-term memory (LSTM)-based methods first learn the person-level action representations by several LSTMs and then integrate all the person-level action representations into the following LSTM to learn the group-level activity representation.
从个体动作层面-->到群体层面。a two-stage strategy。在对话中也是这样,HRED。
但是忽略了时空层面的主从关系?
which neglects the “host-parasite” relationship between the group-level activity (“host”) and person-level actions (“parasite”) in spatiotemporal space.
2)propose a novel graph LSTM-in-LSTM (GLIL) for group activity recognition by modeling the person-level actions and group-level activity simultaneously.
“host-parasite” architecture, which can be seen as several person LSTMs (P-LSTMs) in the local view or a graph LSTM(G-LSTM) in the global view.


The training framework of GLIL is shown in Fig. 2, which stacks:
- a pretrained CNN, :extract the static features (i.e., CNN features) of each person on the person’s bounding boxes.
- a residual LSTM (R-LSTM), :learn the person level residual features of each person from their static features;the person-level temporal features
- the GLIL,
- P-LSTM in GLIL learns and updates the person-level motion state of one person under the interaction with other persons,
- a G-LSTM in GLIL selectively aggregates the person-level motion information from P-LSTM into a new group-level memory cell over time.
Finally, we feed the group-level activity representation output from GLIL into the softmax layer at each time step and then average the outputs of all the softmax classifiers to infer the class of group activity.

考虑了两种类型的邻居:in the spatial space and the temporal space?
1)时间维度上:有两条连边,与前一时刻和后一时刻。
2)空间维度上:有n-1条连边,与空间上的所有邻居结点。
本文最大的创新点在于:对于graph structure 的时空结构,设计了对于结点的LSTM更新(考虑了邻居结点的信息聚合(邻居信息的交互),对LSTM的影响,获得记忆状态和结点表示h);对于图结构的表示,设计了关于每个结点的记忆状态C的聚合(利用了上一时刻的隐状态计算和单人的行为和群体行为的相关性),然后得到整个图,即群体行为的表示h’。从而预测。
在空间维度上,利用的很充分,对于每个结点的表示更新都考虑了当前,上一时刻,邻居。
在时间维度上,利用了上一时刻的h,c
重点关注:
1)P-LSTMs: the interactions among persons under a new interaction gate
For a group activity, each video frame contains multiple-persons’ motion information, which is interrelated in both the spatial space and temporal space. In this article, we consider constructing a graph to explore such relations among persons’ motion. Specifically, the nodes of the graph can represent the state of data, and the edges can capture the spatiotemporal interactions among nodes.
对于一个群体活动,每个视频帧都包含着多人的运动信息,这些信息在空间空间和时间空间上都是相互关联的。在本文中,我们考虑构造一个图来探讨人的运动之间的这种关系。具体来说,图的节点可以代表数据的状态,图的边可以捕捉节点之间的时空交互。
we add a residual connection across the input and the output of LSTM
Such residual connection can provide better flexibility to deal with the gradient vanishing or exploding in the learning process
In the local view, GLIL becomes P-LSTMs that model the person-level motions by the neighboring interaction under an interaction gate.
邻居间的相互作用(通过一个来interaction gate呈现)


对Person-Level的动作表示:
三种输入:当前时刻的结点状态d, 上一时刻结点的隐藏层状态h,邻居结点的上一时刻状态的组合。
计算四个门: 输入门,遗忘门,输出门,邻居遗忘门。
最终计算:当前时刻的记忆状态:memory cell Ct,( cts is the person-level memory cell at time step t.)-->ht
将邻居的隐状态加权求和。Interaction Gate:利用两个人的特征相似度和位置相似度来衡量他们的互动。quantify the interaction between two persons at time step t


Host Architecture of GLIL
what type of person-level motion is useful to infer the class of group activity?
we can set a gate to control what types of person-level motion information would enter or leave the group-level memory cell over time.
we design a new role gate Pi_ts at time step t to allow the person-level motion of the sth person to enter or level group-level memory cell.
如何区别对待,衡量个人行为对群体行为的相关性,因此,我们测量了在前一个时间步上群体级活动表示和人级行动表示的标签推理的一致性->添加一个门:



Host–Parasite(主从关系): Graph LSTM-in-LSTM for Group Activity Recognition的更多相关文章
- Angular2入门系列教程3-多个组件,主从关系
上一篇 Angular2项目初体验-编写自己的第一个组件 好了,前面简单介绍了Angular2的基本开发,并且写了一个非常简单的组件,这篇文章我们将要学会编写多个组件并且有主从关系 现在,假设我们要做 ...
- [转载]窗口之间的主从关系与Z-Order
窗口之间的主从关系与Z-Order 原文地址:http://www.cnblogs.com/dhatbj/p/3288152.html说明:这是本人2008年写的一篇旧文,从未公开发表过.其中除了一小 ...
- MySQL主从关系设置(转)
来源:LAMP兄弟连 作者:李恺 http://***/php/bencandy.php?fid=70&id=635 要做MySQL主从关系的设置,那么就得有两台MySQL主机.所以在开始之前 ...
- 单向LSTM笔记, LSTM做minist数据集分类
单向LSTM笔记, LSTM做minist数据集分类 先介绍下torch.nn.LSTM()这个API 1.input_size: 每一个时步(time_step)输入到lstm单元的维度.(实际输入 ...
- redis迁移复制数据,主从关系建立实践
装redis的机器出了点问题,需要转移数据然后初始化系统,然后我就研究了下redis的数据复制,发现了slaveof 192.168.0.1 6379这个命令,开始踩下这个坑 首先要新的服务器上进入r ...
- 太深了,梯度传不下去,于是有了highway。 干脆连highway的参数都不要,直接变残差,于是有了ResNet。 强行稳定参数的均值和方差,于是有了BatchNorm。RNN梯度不稳定,于是加几个通路和门控,于是有了LSTM。 LSTM简化一下,有了GRU。
请简述神经网络的发展史sigmoid会饱和,造成梯度消失.于是有了ReLU.ReLU负半轴是死区,造成梯度变0.于是有了LeakyReLU,PReLU.强调梯度和权值分布的稳定性,由此有了ELU,以及 ...
- 高强度学习训练第六天总结:Redis主从关系总结
Redis主从复制机制 1.读写分离的好处 性能优化:主服务器专注于写操作,可以更适合写入数据的模式工作:同样,从服务器专注于读操作,可以用更适合读取数据的模式工作. 强化数据安全,避免单点故障:由于 ...
- 在从myql服务器上 取消主从关系和重新构建主从关系
取消主从关系 mysql -uroot -p mysql>show slave status\G; 查看主库是否为之前的ip mysql>change master to master_h ...
- C# WinfForm 控件之dev报表 XtraReport (四) 动态绑定主从关系表
一般的单据都是由主从关系的,比如部门与人员.单据表头与表身.仓库与存货.分类与档案等等 所以主从关系是报表用的最多的 1.准备数据库 简单方便 --主表 create table RdRecord ( ...
随机推荐
- 这3个免费PPT素材网站,一定要收藏
制作PPT,这三个网站的素材绝对够用! 1.象刀设计 https://www.101dao.com 象刀设计里面有非常多PPT模板,这个网站也是主打PPT素材. 分类很清晰,需要什么风格的素材能快速找 ...
- Java 8的18个常用日期处理
Java 8的18个常用日期处理 一.简介 伴随 lambda表达式.streams 以及一系列小优化,Java 8 推出了全新的日期时间API. Java处理日期.日历和时间的不足之处:将 java ...
- 【Python爬虫案例】用Python爬取李子柒B站视频数据
一.视频数据结果 今天是2021.12.7号,前几天用python爬取了李子柒的油管评论并做了数据分析,可移步至: https://www.cnblogs.com/mashukui/p/1622025 ...
- 使用requests爬取梨视频、bilibili视频、汽车之家,bs4遍历文档树、搜索文档树,css选择器
今日内容概要 使用requests爬取梨视频 requests+bs4爬取汽车之家 bs4遍历文档树 bs4搜索文档树 css选择器 内容详细 1.使用requests爬取梨视频 # 模拟发送http ...
- 基于 range 的 for 循环和 auto
基于 range 的 for 循环和 auto C++11 引入一种循环的新形式,叫基于 range 的 for 循环,它允许我们用更简单易读的形式遍历容器中的所有元素 vector<int&g ...
- WPF中的依赖属性
1. WPF中的依赖属性 依赖属性是专门基于WPF创建的.在WPF库实现中,依赖属性使用普通的C#属性进行了包装,使用方法与普通的属性是相同的. 1.1 依赖属性提供的属性功能 资源 数据绑定 样式 ...
- Spring Boot+微信小程序_保存微信登录者的个人信息
1. 前言 微信小程序开发平台,提供有一类 API,可以让开发者获取到微信登录用户的个人数据.这类 API 统称为开放接口. Tip:微信小程序开发平台,会把微信登录用户的个人信息分为明文数据和敏感数 ...
- Spring Boot 动态修改 log level
引入依赖 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>sp ...
- Ubuntu的一些软件源
参考别人的,自己记录一下,怕丢失 修改方法:vim /etc/apt/sources.list,然后添加下面对应的代码区 台湾的官方源 deb http://tw.archive.ubuntu.com ...
- Flask框架实现登录注册功能(mysql数据库)
前言: 本例使用Flask框架完成登录和注册操作,包括前端(index.html,regist.html)和后端(app.py)两部分,前端页面不过多介绍,直接进入后端部分: 逻辑思路: 登录部分:运 ...