AI佳作解读系列(四)——数据增强篇

【AI佳作解读系列(四)——数据增强篇】的更多相关文章

AI佳作解读系列(四)——数据增强篇

前言在深度学习的应用过程中,数据的重要性不言而喻.继上篇介绍了数据合成(个人认为其在某种程度上可被看成一种数据增强方法)这个主题后,本篇聚焦于数据增强来介绍几篇杰作! (1)NanoNets : How to use Deep Learning when you have Limited Data (2)Data Augmentation | How to use Deep Learning when you have Limited Data—Part 2 网上也已经有了上述文章的翻译,推荐…

AI佳作解读系列(二)——目标检测AI算法集杂谈：R-CNN，faster R-CNN，yolo，SSD，yoloV2，yoloV3

1 引言深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理.本文着重与分析目标检测领域的深度学习方法,对其中的经典模型框架进行深入分析. 目标检测可以理解为是物体识别和物体定位的综合,不仅仅要识别出物体属于哪个分类,更重要的是得到物体在图片中的具体位置. 为了完成这两个任务,目标检测模型分为两类.一类是two-stage,将物体识别和物体定位分为两个步骤,分别完成,这一类的典型代表是R-CNN, fast R-CNN, faster-RCNN家族.他们识别…

AI佳作解读系列(一)——深度学习模型训练痛点及解决方法

1 模型训练基本步骤进入了AI领域,学习了手写字识别等几个demo后,就会发现深度学习模型训练是十分关键和有挑战性的.选定了网络结构后,深度学习训练过程基本大同小异,一般分为如下几个步骤定义算法公式,也就是神经网络的前向算法.我们一般使用现成的网络,如inceptionV4,mobilenet等. 定义loss,选择优化器,来让loss最小对数据进行迭代训练,使loss到达最小在测试集或者验证集上对准确率进行评估下面我们来看深度学习模型训练中遇到的难点及如何解决 2 模型训练难点及解决…

AI佳作解读系列(三)——深度学习中的合成数据研究

Below are some investigation resources for synthetic datasets: 1. Synthetic datasets vs. real images for computer vision algorithm evaluation? https://www.researchgate.net/post/Synthetic_datasets_vs_real_images_for_computer_vision_algorithm_evaluatio…

AI佳作解读系列(六) －生成对抗网络（GAN）综述精华

注:本文来自机器之心的PaperWeekly系列:万字综述之生成对抗网络(GAN),如有侵权,请联系删除,谢谢! 前阵子学习 GAN 的过程发现现在的 GAN 综述文章大都是 2016 年 Ian Goodfellow 或者自动化所王飞跃老师那篇.可是在深度学习,GAN领域,其进展都是以月来计算的,感觉那两篇综述有些老了.最近发现有一篇最新的 GAN 综述论文(How Generative Adversarial Networks and Their Variants Work: An Over…

AI佳作解读系列(五) －目标检测二十年技术综述

计算机视觉中的目标检测,因其在真实世界的大量应用需求,比如自动驾驶.视频监控.机器人视觉等,而被研究学者广泛关注. 上周四,arXiv新出一篇目标检测文献<Object Detection in 20 Years: A Survey>,其对该领域20年来出现的技术进行了综述,这是一篇投向PAMI的论文,作者们review了400+篇论文,总结了目标检测发展的里程碑算法和state-of-the-art,并且难能可贵的对算法流程各个技术模块的演进也进行了说明,还深入到目标检测的特定领域,如人…

Alamofire源码解读系列(四)之参数编码(ParameterEncoding)

本篇讲解参数编码的内容前言我们在开发中发的每一个请求都是通过URLRequest来进行封装的,可以通过一个URL生成URLRequest.那么如果我有一个参数字典,这个参数字典又是如何从客户端传递到服务器的呢? Alamofire中是这样使用的: URLEncoding 和URL相关的编码,有两种编码方式: 直接拼接到URL中通过request的httpBody传值 JSONEncoding 把参数字典编码成JSONData后赋值给request的httpBody PropertyList…

一步一步学EF系列四【升级篇实体与数据库的映射】

之前的三张为基础篇,如果不考虑架构问题,做一般的小程序,以足够用了.基本的增删改查也都有了.但是作为学习显然是不够的.通过之前三章的学习,有没有发现这样写有什么问题,有没有觉得繁琐的?可能有人会说,之前的三篇总共加起来代码也就几十行哪里繁琐了.呵呵,是不是觉得EF很强大.但是其实按照之前的写法的话是比较繁琐的,为什么呢?这就是本文的重点接着往下看!!! 先看一下之前的配置类回顾我们的范例是只有两张表,然后需要配置映射关系的时候在 DbContext,的OnModelCreating进行配置.…

[Hadoop源码解读]（四）MapReduce篇之Counter相关类

当我们定义一个Counter时,我们首先要定义一枚举类型: public static enum MY_COUNTER{ CORRUPTED_DATA_COUNTER, NORMAL_DATA_COUNTER }; 然后,我们就可以在mapper或reducer里面增加它的值: context.getCounter(MY_COUNTER.CORRUPTED_DATA_COUNTER).increment(1); 我们在第(一)篇讲InputFormat时,我们有看到Mapper.class中的C…

StartDT AI Lab | 数据增强技术如何实现场景落地与业务增值？

有人说,「深度学习“等于”深度卷积神经网络算法模型+大规模数据+云端分布式算力」.也有人说,「能够在业内叱咤风云的AI都曾“身经百战”,经历过无数次的训练与试错」.以上都需要海量数据做依托,对于那些数据量匮乏的领域,就衍生出了数据增强技术.即,根据一个原始数据,稍作改动,变成一个对于AI来说的全新的数据. 01 为什么做数据增强? 数据规模的重要性到底怎样呢?可以说,深度学习的火热和蓬勃发展,直接源于普林斯顿大学教授李飞飞及她所带领的团队创作的一个包含百万级图片的数据集ImageNet.工业级人…