Videos as Space-Time Region Graphs ECCV 2018 Xiaolong Wang 2018-08-03 11:16:01 Paper:arXiv 本文利用视频中时空上的 proposal 之间的关系,来进行行为识别的建模. 如上图所示,本文将 video 看做是 a graph of objects,然后在该 graph 上进行行为识别的推理.整体的模型如图 2 所示,该方法将视频连续 5 秒的视频作为输入,传递给 3D-CNN.3D CNN 的输出是一个四维…