Host–Parasite(主从关系): Graph LSTM-in-LSTM for Group Activity Recognition
This article aims to tackle the problem of group activity recognition in the multiple-person scene.
1)以往模型忽略:most long short-term memory (LSTM)-based methods first learn the person-level action representations by several LSTMs and then integrate all the person-level action representations into the following LSTM to learn the group-level activity representation.
从个体动作层面-->到群体层面。a two-stage strategy。在对话中也是这样,HRED。
但是忽略了时空层面的主从关系?
which neglects the “host-parasite” relationship between the group-level activity (“host”) and person-level actions (“parasite”) in spatiotemporal space.
2)propose a novel graph LSTM-in-LSTM (GLIL) for group activity recognition by modeling the person-level actions and group-level activity simultaneously.
“host-parasite” architecture, which can be seen as several person LSTMs (P-LSTMs) in the local view or a graph LSTM(G-LSTM) in the global view.


The training framework of GLIL is shown in Fig. 2, which stacks:
- a pretrained CNN, :extract the static features (i.e., CNN features) of each person on the person’s bounding boxes.
- a residual LSTM (R-LSTM), :learn the person level residual features of each person from their static features;the person-level temporal features
- the GLIL,
- P-LSTM in GLIL learns and updates the person-level motion state of one person under the interaction with other persons,
- a G-LSTM in GLIL selectively aggregates the person-level motion information from P-LSTM into a new group-level memory cell over time.
Finally, we feed the group-level activity representation output from GLIL into the softmax layer at each time step and then average the outputs of all the softmax classifiers to infer the class of group activity.

考虑了两种类型的邻居:in the spatial space and the temporal space?
1)时间维度上:有两条连边,与前一时刻和后一时刻。
2)空间维度上:有n-1条连边,与空间上的所有邻居结点。
本文最大的创新点在于:对于graph structure 的时空结构,设计了对于结点的LSTM更新(考虑了邻居结点的信息聚合(邻居信息的交互),对LSTM的影响,获得记忆状态和结点表示h);对于图结构的表示,设计了关于每个结点的记忆状态C的聚合(利用了上一时刻的隐状态计算和单人的行为和群体行为的相关性),然后得到整个图,即群体行为的表示h’。从而预测。
在空间维度上,利用的很充分,对于每个结点的表示更新都考虑了当前,上一时刻,邻居。
在时间维度上,利用了上一时刻的h,c
重点关注:
1)P-LSTMs: the interactions among persons under a new interaction gate
For a group activity, each video frame contains multiple-persons’ motion information, which is interrelated in both the spatial space and temporal space. In this article, we consider constructing a graph to explore such relations among persons’ motion. Specifically, the nodes of the graph can represent the state of data, and the edges can capture the spatiotemporal interactions among nodes.
对于一个群体活动,每个视频帧都包含着多人的运动信息,这些信息在空间空间和时间空间上都是相互关联的。在本文中,我们考虑构造一个图来探讨人的运动之间的这种关系。具体来说,图的节点可以代表数据的状态,图的边可以捕捉节点之间的时空交互。
we add a residual connection across the input and the output of LSTM
Such residual connection can provide better flexibility to deal with the gradient vanishing or exploding in the learning process
In the local view, GLIL becomes P-LSTMs that model the person-level motions by the neighboring interaction under an interaction gate.
邻居间的相互作用(通过一个来interaction gate呈现)


对Person-Level的动作表示:
三种输入:当前时刻的结点状态d, 上一时刻结点的隐藏层状态h,邻居结点的上一时刻状态的组合。
计算四个门: 输入门,遗忘门,输出门,邻居遗忘门。
最终计算:当前时刻的记忆状态:memory cell Ct,( cts is the person-level memory cell at time step t.)-->ht
将邻居的隐状态加权求和。Interaction Gate:利用两个人的特征相似度和位置相似度来衡量他们的互动。quantify the interaction between two persons at time step t


Host Architecture of GLIL
what type of person-level motion is useful to infer the class of group activity?
we can set a gate to control what types of person-level motion information would enter or leave the group-level memory cell over time.
we design a new role gate Pi_ts at time step t to allow the person-level motion of the sth person to enter or level group-level memory cell.
如何区别对待,衡量个人行为对群体行为的相关性,因此,我们测量了在前一个时间步上群体级活动表示和人级行动表示的标签推理的一致性->添加一个门:



Host–Parasite(主从关系): Graph LSTM-in-LSTM for Group Activity Recognition的更多相关文章
- Angular2入门系列教程3-多个组件,主从关系
上一篇 Angular2项目初体验-编写自己的第一个组件 好了,前面简单介绍了Angular2的基本开发,并且写了一个非常简单的组件,这篇文章我们将要学会编写多个组件并且有主从关系 现在,假设我们要做 ...
- [转载]窗口之间的主从关系与Z-Order
窗口之间的主从关系与Z-Order 原文地址:http://www.cnblogs.com/dhatbj/p/3288152.html说明:这是本人2008年写的一篇旧文,从未公开发表过.其中除了一小 ...
- MySQL主从关系设置(转)
来源:LAMP兄弟连 作者:李恺 http://***/php/bencandy.php?fid=70&id=635 要做MySQL主从关系的设置,那么就得有两台MySQL主机.所以在开始之前 ...
- 单向LSTM笔记, LSTM做minist数据集分类
单向LSTM笔记, LSTM做minist数据集分类 先介绍下torch.nn.LSTM()这个API 1.input_size: 每一个时步(time_step)输入到lstm单元的维度.(实际输入 ...
- redis迁移复制数据,主从关系建立实践
装redis的机器出了点问题,需要转移数据然后初始化系统,然后我就研究了下redis的数据复制,发现了slaveof 192.168.0.1 6379这个命令,开始踩下这个坑 首先要新的服务器上进入r ...
- 太深了,梯度传不下去,于是有了highway。 干脆连highway的参数都不要,直接变残差,于是有了ResNet。 强行稳定参数的均值和方差,于是有了BatchNorm。RNN梯度不稳定,于是加几个通路和门控,于是有了LSTM。 LSTM简化一下,有了GRU。
请简述神经网络的发展史sigmoid会饱和,造成梯度消失.于是有了ReLU.ReLU负半轴是死区,造成梯度变0.于是有了LeakyReLU,PReLU.强调梯度和权值分布的稳定性,由此有了ELU,以及 ...
- 高强度学习训练第六天总结:Redis主从关系总结
Redis主从复制机制 1.读写分离的好处 性能优化:主服务器专注于写操作,可以更适合写入数据的模式工作:同样,从服务器专注于读操作,可以用更适合读取数据的模式工作. 强化数据安全,避免单点故障:由于 ...
- 在从myql服务器上 取消主从关系和重新构建主从关系
取消主从关系 mysql -uroot -p mysql>show slave status\G; 查看主库是否为之前的ip mysql>change master to master_h ...
- C# WinfForm 控件之dev报表 XtraReport (四) 动态绑定主从关系表
一般的单据都是由主从关系的,比如部门与人员.单据表头与表身.仓库与存货.分类与档案等等 所以主从关系是报表用的最多的 1.准备数据库 简单方便 --主表 create table RdRecord ( ...
随机推荐
- 【HCIE】ipv6之6to4隧道如何计算48位前缀地址
6to4隧道支持router-router,host-router,router-host,host-host 采用专用6to4地址,前缀为2002::/16 其中如何结合ipv4地址? 2002:i ...
- Redis 内存满了怎么办?这样设置才正确!
上回在<Redis 数据过期了会被立马删除么?>说到如果过期的数据太多,定时删除无法删除完全(每次删除完过期的 key 还是超过 25%),同时这些 key 再也不会被客户端请求,就无法走 ...
- SpringJDBC和事务控制
SpringJDBC和事务控制 主要内容 1.基本配置 <!--依赖导入--> <dependencies> <!-- 添加相关的依赖坐标 --> <!-- ...
- [题解] [AGC024F] Simple Subsequence Problem
题目大意 有一个 01 串集合 \(S\),其中每个串的长度都不超过 \(N\),你要求出 \(S\) 中至少是 \(K\) 个串的子序列的最长串,如果有多解,输出字典序最小的那组解. 由于 \(S\ ...
- Vue-router(前端路由)的两种路由模式
Vue的两种路由模式: hash.history:默认是hash模式: 前端路由(改变视图的同时不会向后端发出请求) 一.什么是hash模式和history模式? hash模式:是指url尾巴后的#号 ...
- HDFS High Availability(HA)高可用配置
高可用性(英语:high availability,缩写为 HA) IT术语,指系统无中断地执行其功能的能力,代表系统的可用性程度.是进行系统设计时的准则之一. 高可用性系统意味着系统服务可以更长时间 ...
- 【mq】从零开始实现 mq-12-消息的批量发送与回执
前景回顾 [mq]从零开始实现 mq-01-生产者.消费者启动 [mq]从零开始实现 mq-02-如何实现生产者调用消费者? [mq]从零开始实现 mq-03-引入 broker 中间人 [mq]从零 ...
- WinUI3开发笔记(Ⅱ)
WinUI3中的"MessageBox.Show()" # (一,如何实现) "开发WinUI3,第一个不适就是消息弹窗!" WinUI中没有C#.NetFra ...
- css属性补充与JS数据类型
目录 溢出属性(overflow) 定位(position) z-index属性 opacity不透明度 JavaScript简介 变量与注释 数据类型 数值(Number) 字符串(String) ...
- python目录索引
python目录索引 python基础数据类型1 目录 part1 part2 运算符 格式化 part3 字符串 字符串常用操作方法 part4 列表 列表的创建: 列表的索引,切片 列表的增删改查 ...