论文笔记:(2017NIPS)DeepSets
Deep Sets
论文地址:https://paperswithcode.com/paper/deep-sets
代码:https://github.com/manzilzaheer/DeepSets
https://github.com/yassersouri/pytorch-deep-sets
https://github.com/dpernes/deepsets-digitsum
摘要
我们研究了定义在集合上的机器学习任务的模型设计问题。与在固定维度向量上操作的传统方法相反,我们考虑了定义在集合上的目标函数对集合是置换不变的。从人口统计估计[1]到堤坝压力计数据的异常检测[2]到宇宙学[3,4],这些问题普遍存在。我们的主要定理描述了置换不变函数,并提供了一个函数族,任何置换不变的目标函数一定属于这个函数族。这个函数族具有特殊的结构,即它能使我们设计一种定义在集合上的深度网络体系结构,并且可以部署在包括无监督学习和有监督学习任务在内的各种情况下。我们还推导出了深度模型中置换等变性的必要和充分条件。我们证明了我们的方法在人口统计估计,点云分类,集合扩展和离群值检测上的适用性。
一、引言
典型的机器学习算法,如回归或分类,是针对固定维度的数据实例设计的。当输入或输出是置换不变的集合而不是固定维数的向量时,它们的扩展处理这种情况并非易事,研究人员最近才开始研究它们[5-8]。在本文中,我们提出了一个通用框架来处理机器学习任务中的输入和可能的输出实例是集合的情况。
与固定维度数据实例类似,我们可以描述集合情况下的两种学习范式。在监督学习中,对于集合元素的置换不变或等变的集合,我们有一个输出标签。包括诸如人口统计估计[1]之类的任务的例子,其应用范围从千兆级宇宙学[3,4]到纳米级量子化学[9]。
其次,还可以是无监督情况,该情况需要学习"集合"的结构,例如通过利用集合内的同质性/异质性。一个例子是集合的扩展任务 (又称受众拓展),即给定一组彼此相似的对象(如一组词{lion, tiger, leopard}),我们的目标是从大量的候选对象中找到新的对象,使所选的新对象与查询集相似(例如,在所有英语单词中,找到像美洲虎或猎豹这样的词)。这是相似性搜索和度量学习中的一个标准问题,典型的应用是在给定少量可能的标签的情况下找到新的图像标签。同样,在计算广告领域中,给定一组高价值客户,目标是找到相似的人。在许多科学应用中,这是一个重要的问题。例如,给定一小组有趣的天体,天体物理学家可能想在大型天体测量中找到类似的天体。
主要贡献
(i)我们提出了一个基本的体系结构——DeepSets,来处理集合作为输入的问题,并证明了这个体系结构的性质是充分必要的(第2节);
(ii)我们扩展了这个体系结构,允许对任意对象进行调节;
(iii)基于这个体系结构,我们开发了一个深度网络,它可以对不同大小的集合进行操作(第3节),我们证明了一个简单的参数共享方案能够对监督和半监督情况下的集合进行一般处理。
(iv)最后,我们通过对各种问题的实验证明了我们框架的广泛适用性(第4节)。
二、置换不变性和等变性
2.1 问题定义
2.2 结构
2.3 相关结果
三、Deep Sets
3.1 架构
3.2 其他相关工作
四、应用和实验结果
我们介绍了DeepSet的各种应用程序。对于有监督的设置,我们将DeepSets应用于人口统计的估计、数字和和点云的分类以及带有聚类辅助信息的回归。DeepSets的置换等变变化适用于异常值检测任务。最后,我们研究了DeepSets在无监督集合扩展中的应用,特别是概念集检索和图像标记。在大多数情况下,我们将我们的方法与最新技术进行比较,并报告竞争结果。
4.1 设置输入标量响应
4.1.1 监督学习:学习估计人口统计
在第一个实验中,我们学习了高斯分布的熵和互信息,而没有向DeepSets提供任何关于高斯性的信息。高斯矩阵的生成方法如下:
- 旋转
- 相关性
- 排列1
- 随机
4.1.2 数字和
接下来,我们比较如果将集合数据作为序列处理会发生什么。我们考虑寻找给定数字集合的和的任务。我们考虑这个实验的两个变体:文本和图片
4.1.3 点云分类
点云是一组低维向量。这种类型的数据经常在机器人,视觉和宇宙学等各种应用中遇到。在这些应用中,现有方法通常将点云数据转换为体素或网格表示,作为预处理步骤,例如[26,29,30]。由于许多距离传感器(例如LiDAR)的输出都是点云的形式,因此非常需要将深度学习方法直接应用于点云。此外,与像素化3D对象相比,在处理点云时应用旋转和平移等转换既简单又便宜。
4.1.4 使用聚类信息改进的红移估计
宇宙学中一个重要的回归问题是根据光度学观测估计星系的红移,该红移对应于它们的年龄以及与我们的距离[33]。一种从光度学观测中估计红移的方法是在银河星团上使用回归模型[34]。每个银河系的预测不会通过排列星系团成员而改变。因此,我们可以将每个星系团视为一个“集合”,并使用DeepSets来估计各个星系的红移。有关更多详细信息,请参见附录G。
4.2 集合扩展
在集合扩展任务中,我们得到了一组彼此相似的对象,我们的目标是从大量候选对象中查找新对象,以使所选的新对象与查询集相似。为了实现这一点,需要推理出连接给定集合的概念,然后根据它们与所推断概念的相关性来检索单词。由于潜在的应用范围很广,因此这是一项重要的任务,包括个性化信息检索,计算广告,标记大量未标记或标记较弱的数据集。
4.2.1 文本概念集合检索
4.2.2 图像标签
4.3 设置异常检测
五、总结
在这篇文章中,我们开发了DeepSets以及支持其性能的理论,DeepSets是一个基于强大的置换不变性和等变特性的模型。我们通过大量的实验证明了DeepSets在多个领域的泛化能力,并展示了定性和定量的结果。特别是,我们明确表明,DeepSets优于其他没有理论支持的直觉深度网络(第4.2.1节、第4.1.2节)。最后,值得注意的是,我们所比较的最新技术是针对每个任务的一种专门技术,而我们的一个模型(即DeepSets)具有全面的竞争力。
论文笔记:(2017NIPS)DeepSets的更多相关文章
- Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现(转)
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
- 论文笔记之:Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
- Deep Learning论文笔记之(八)Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
- Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构 标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
- Deep Learning论文笔记之(六)Multi-Stage多级架构分析
Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些 ...
- Multimodal —— 看图说话(Image Caption)任务的论文笔记(一)评价指标和NIC模型
看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字.这项任务要求模型可以识别图 ...
- 论文笔记(1):Deep Learning.
论文笔记1:Deep Learning 2015年,深度学习三位大牛(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),合作在Nature ...
- 论文笔记(2):A fast learning algorithm for deep belief nets.
论文笔记(2):A fast learning algorithm for deep belief nets. 这几天继续学习一篇论文,Hinton的A Fast Learning Algorithm ...
- 论文笔记:Towards Diverse and Natural Image Descriptions via a Conditional GAN
论文笔记:Towards Diverse and Natural Image Descriptions via a Conditional GAN ICCV 2017 Paper: http://op ...
- 【论文笔记】Malware Detection with Deep Neural Network Using Process Behavior
[论文笔记]Malware Detection with Deep Neural Network Using Process Behavior 论文基本信息 会议: IEEE(2016 IEEE 40 ...
随机推荐
- 【dog与lxy】8.25题解-land
land 题目描述 dog终于有了一块领地,但是现在可怜的dog面临着lxy的入侵,于是他决定在自己的领地设置炮楼来保卫自己免受QJ.现在dog找到它可以在领地上设置炮楼的N个地点.但是留给dog的时 ...
- NOIP模拟测试14「旋转子段·走格子·柱状图」
旋转子段 连60分都没想,考试一直肝t3,t2,没想到t1最简单 我一直以为t1很难,看了题解发现也就那样 题解 性质1 一个包含a[i]旋转区间值域范围最多为min(a[i],i)----max(a ...
- 日常BUG-01 之 @Sl4j
问题描述: 需要打印日志,使用的是lombok包中的sl4j,lombok依赖如下: <dependency> <groupId>org.projectlombok</g ...
- 源码搭建Zabbix4.0.23LTS监控系统
实验环境 centos 7.5 主机名 IP地址 配置 应用 controlnode 172.16.1.120/24 4核/8G/60G java-1.8.0-openjdk zabbix serve ...
- 07 修改JumpServer网页信息
1.7.修改JumpServer网页信息 注意:在修改相关配置文件之前要先进行备份,防止文件修改错误无法恢复. 1.Luna图标: /opt/luna/static/imgs/logo.png 2.j ...
- 14、redis安装及数据类型
14.0.服务器配置: 服务器名称 ip地址 controller-node1 172.16.1.90 14.1.什么是redis: 1.redis的特点: (1)redis是一个开源的使用c语言编写 ...
- MyBatis温故而知新-底层运行原理
准备工作 public class MainClass { public static void main(String[] args) throws Exception { String resou ...
- yolov5 AssertionError: Image Not Found解决方案
运行yolov5 train.py报错:AssertionError: Image Not Found ../data/images/xxx.png 运行环境 一开始在笔记本上用显卡跑训练是可 ...
- 一分钟了解JDBC的构成和原理
JDBC(一组接口组成) : 形式如下: 1:JDBC-ODBC桥接技术(100%不用) 在Windows中有ODBC技术,ODBC指的是开放数据库链接 是由微软提供的数据库连接应用,而Java可以利 ...
- ACM金牌选手整理的【LeetCode刷题顺序】
算法和数据结构知识点图 首先,了解算法和数据结构有哪些知识点,在后面的学习中有 大局观,对学习和刷题十分有帮助. 下面是我花了一天时间花的算法和数据结构的知识结构,大家可以看看. 后面是为大家 精心挑 ...