AutoML文献阅读
逐步会更新阅读过的AutoML文献(其实是NAS),以及自己的一些思考
- Progressive Neural Architecture Search,2018ECCV的文章;
目的是:Speed up NAS by proposing an alternative algorithm (Progressive Search),
具体方法:采取Learning transferable architectures for scalable image recognition中相似的搜索空间,也就是block->cell->network;采用simple to complex的搜索策略,

网络结构

Cell结构

Block结构
为了减少搜索空间,采用的搜索算法如下:

搜索算法
个人评论:采用了进化算法的思想,以及训练一个预测器,来预测网络性能,但是具体怎么预测并没有说明。
2.Efficient Neural Architecture Search via Parameter Sharing,大名鼎鼎的ENAS,采用权重共享的方法,2018CVPR的文章
目的是:Improve the efficiencyo of NAS to eschew training each child model from scratch to convergence,也就是减少每个子模型训练到收敛的时间。
IDEAS是:让每个子模型都共享一套权重;在一个超网络下,构建很多的子网络
3.Transfer NAS: Knowledge Transfer between Search Spaces with Transformer Agents,2019ICML的workshop,私以为可以结合第1篇进行修改。
目的是:针对不同搜索空间需要重新搜索的问题,提出了一个支持联合学习和快速迁移先验知识的基于transformer的多搜索空间和任务的agent,用于搜索空间迁移
4. EAT-NAS: Elastic Architecture Transfer for Accelerating Large-scale Neural Architecture Search,可以算是地平线出品
目的是:更好地把小数据的网络结构迁移到大数据上,因为目前很少有直接在ImageNet上搜索网络结构的工作,一般是在小数据集(CIFAR10)上训练好,然后直接迁移到ImageNet上,但这样
不能保证迁移后的网络性能。
具体方法:在CIFAR10上搜索得到一个最优网络后,作为种子结构传给ImageNet;首先使用进化算法进行basic architecture的搜索(best model on the samll dataset),然后作为种子进行large dataset的初始化,这使得larget dataset的搜索更快速并且方向更正确
5. Multinomial Distribution Learning for Effective Neural Architecture Search,2019ICCV的文章,主要是刷新搜索时间和网络精度,在搜索算法上进行革新;作者知乎ID风车车,从机械到计算机视觉,非常励志,是我学习的榜样,而且今年才研一已经至少两篇顶会了!还有一篇Dynamic Distribution Pruning for Efficient Network Architecture Search
目的是:把网络结构选择转换成一个多项式分布学习问题,主要是假设每个模型在训练阶段的性能排名都是相同的,即好的一开始就好,差的一开始就差
6. Evaluating the Search Phase of Neural Architecture Search,很有批判性的一篇文章,主要是为了搞清楚NAS算法背后的运行情况
首先证明了随机搜索的平均性能比目前的NAS方法要好,其次是NAS算法的排名和结果并不能代表真正的网络结构性能;权重共享策略会影响网络的训练,从而影响搜索过程的有效性。具体来说权重共享打乱了按照真实训练每个网络结构得到的排名
7. On Network Design Spaces for Visual Recognition,对设计空间进行了探索,主要是发现设计空间之间的差异,依次来解释模型的性能,作为一个case应用在了NAS上,因为NAS专注于在一个搜索空间找到最佳网络,而这篇论文关注搜索空间(设计空间)本身,得出了一个结论,最近的NAS方法很大程度上忽略了设计空间上的差异;通过对五个NAS方法的搜索空间的分析,论文认为随着NAS的发展,搜索得到的网络精度的提高可能一部分受益于搜索空间的改进,比如DARTS的搜索空间最优,而NASNet则最差;论文也将DARTS、NASNet搜索空间和ResNeXt作了对比,发现DARTS和ResNeXt差不多,而NASNet依旧是最差的。
结论是:搜索空间的设计其实很重要,未来应该要出现一些设计搜索空间的工作,无论是手工方法还是数据驱动方法
AutoML文献阅读的更多相关文章
- 文献阅读笔记——group sparsity and geometry constrained dictionary
周五实验室有同学报告了ICCV2013的一篇论文group sparsity and geometry constrained dictionary learning for action recog ...
- 文献阅读 | The single-cell transcriptional landscape of mammalian organogenesis | 器官形成 | 单细胞转录组
The single-cell transcriptional landscape of mammalian organogenesis 老板已经提了无数遍的文章,确实很nb,这个工作是之前我们无法想 ...
- 空间插值文献阅读(Geostatistical approaches for incorporating elevation into the spatial interpolation of rainfall)
空间插值技术应用必读论文---P. Goovaerts, Geostatistical approaches for incorporating elevation into the spatial ...
- 文献阅读方法 & 如何阅读英文文献 - 施一公(转)
附: 如何看懂英文文献?(好) 看需求,分层次 如何总结和整理学术文献? Mendeley & Everything 如何在pdf文献上做笔记?福晰阅读器 自己感悟: 一篇专业文献通常会有几页 ...
- phd文献阅读日志-博一上学期
为了记住并提醒自己阅读文献,进行了记录(这些论文都是我看过理解的),论文一直在更新中. 博一上学期: 1.week 6,2017.10.16 2014-Automatic Semantic Model ...
- RTCM32编解码中的一些概念及相关文献阅读
1. IODC和 IODE —— 导航电文相关.iode/iodc是在GPS系统的ICD2中定义的参数,iode指星历数据事件,iodc指星钟数据事件. IOD 是 issue of data ,数 ...
- 文献阅读报告 - Social BiGAT + Cycle GAN
原文文献 Social BiGAT : Kosaraju V, Sadeghian A, Martín-Martín R, et al. Social-BiGAT: Multimodal Trajec ...
- 文献阅读报告 - Social Ways: Learning Multi-Modal Distributions of Pedestrian Trajectories with GANs
文献引用 Amirian J, Hayet J B, Pettre J. Social Ways: Learning Multi-Modal Distributions of Pedestrian T ...
- 文献阅读 - MonoLoco与关于Camera Matrix的笔记
目录 概览 HighLights Camera Intrinsic Matrix 笔记 Intrinsic Matrix Task-Error - 不确定性任务下确界的计算 输出假设的Laplace分 ...
随机推荐
- C++线程同步 -- windows
简介: 在一般情况下,创建一个线程是不能提高程序的执行效率的,所以要创建多个线程.但是多个线程同时运行的时候可能调用线程函数,在多个线程同时对同一个内存地址进行写入, 由于CPU时间调度上的问题,写入 ...
- 约会 Rendezvous:基环树
提炼:tarjan判环,dfs建树,倍增lca,预处理环两点间距离 我犯的错误: 1.基环树不只有一棵,可以有很多 2.自环不能将其忽略,(对于我的算法)应该将其特殊考虑在算法内 3.代码一定要简洁有 ...
- Python分布式+云计算
参考: http://wiki.python.org/moin/ParallelProcessing http://wiki.python.org/moin/DistributedProgrammin ...
- C++ std::vector 总结笔记
Initialization #include<iostream> #include<vector> using namespace std; int main() { vec ...
- vue父组件异步获取动态数据传递给子组件获取不到值
原理: 在父组件中使用axios获取异步数据传给子组件,但是发现子组件在渲染的时候并没有数据,在created里面打印也是空的,结果发现一开始子组件绑定的数据是空的,在请求数据没有返回数据时,子组件就 ...
- mysql分组排序加序号
参照https://www.cnblogs.com/CharlieLau/p/6737243.html 一.需求 新加一个Sort 字段,初始值为1,按照parentID分组添加sort值. 根据原数 ...
- 1222/2516. Kup
题目描述 Description 首先你们得承认今天的题目很短很简洁... 然后,你们还得承认接下来这个题目的描述更加简洁!!! Task:给出一个N*N(1≤N≤2000)的矩阵,还给出一个整数K. ...
- #424 Div2 Problem C Jury Marks (二分 && 暴力 && std::unique && 思维)
题目链接 :http://codeforces.com/contest/831/problem/C 题意 :选手有一个初始积分,接下来有k个裁判为他加分或减分(时间顺序给出),然后告诉你n(1< ...
- HDU2196computer
就是求每个点为起始点的最长链的长度. 写一下各个数组的意思吧. f[i][0]为点i向下走最长的距离:f[i][1]为点i向下走第二长的距离: xia[i][0]为点i向下走最长距离所要走的儿子节点: ...
- Jenkins部署从节点
由于jenkins上承载项目太多,需要专门的节点来执行需要构建的操作. 参考:https://www.cnblogs.com/lxs1314/p/7551309.html job仅使用绑定的slave ...