比较 VGG, resnet和inception的图像分类效果

简介

VGG, resnet和inception是3种典型的卷积神经网络结构。

VGG采用了3*3的卷积核，逐步扩大通道数量
resnet中，每两层卷积增加一个旁路
inception实现了卷积核的并联，然后把各自通道拼接到一起

简单起见，直接使用了[1]的代码来测试 resnet，然后用[2],[4]的代码替换[1]中的model，改了改通道，测 VGG 和 inception。

GPU是gtx1050，主板开始是 x79，后来坏了，换成 x470，GPU占比提高很多。

CPU占比始终100%

实验结果

超参数：epochs=80,lr=0.001,optim=Adam

数据集：cifar10

_	参数个数(k)	训练时间(m)	精度(%)	GPU内存(M)	GPU占比(%)
resnet	195	22	88	607	99
vgg_bn	207	17	84	535	60
inception	107	19	80	613	98

结论：条条道路通罗马。

附加实验

因为方便，注释掉 Batch Normalization，以及 Data Augmentation 又试了两次。

_	参数个数(k)	训练时间(m)	精度(%)	GPU内存(M)	GPU占比(%)
resnet	195	22	88	607	99
resnet-BN	195	19	86	553	99
resnet-DA	195	22	64	607	99

结论：Data Augmentation很重要

代码改动

class ResNet(nn.Module):

    def __init__(self, block, layers, num_classes=10):

        super(ResNet, self).__init__()

        self.in_channels = 16

        self.conv = conv3x3(3, 16)

        self.bn = nn.BatchNorm2d(16)

        self.relu = nn.ReLU(inplace=True)

        self.layer1 = self.make_layer(block, 16, layers[0])

        self.layer2 = self.make_layer(block, 32, layers[1], 2)

        self.layer3 = self.make_layer(block, 64, layers[2], 2)

        self.avg_pool = nn.AvgPool2d(8)

        self.fc = nn.Linear(64, num_classes)

print('# generator parameters:', sum(param.numel() for param in model.parameters()))

class VGG(nn.Module):

    def __init__(self, features, num_classes=10, init_weights=True):

        super(VGG, self).__init__()

        self.features = features

        self.avgpool = nn.AdaptiveAvgPool2d((3, 3))

        self.classifier = nn.Sequential(

            nn.Linear(9 * 8 * 8, 64),

            nn.ReLU(True),

            #nn.Dropout(),

            nn.Linear(64, 64),

            nn.ReLU(True),

            #nn.Dropout(),

            nn.Linear(64, num_classes),

        )

def vgg_bn(**kwargs):

    cfg = [16, 16, 'M', 32, 32, 'M', 32, 32, 'M', 64, 64, 'M', 64, 64, 'M']

    model = VGG(make_layers(cfg, batch_norm=True), **kwargs)

class Inception_v1(nn.Module):

    def __init__(self, num_classes=10):

        super(Inception_v1, self).__init__()

        #conv2d0

        self.conv1 = conv3x3(3, 6)

        self.max_pool1 = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)

        self.lrn1 = nn.BatchNorm2d(6)

        self.inception_3a = Inception_base(1, 6, [[16], [16,32], [8, 16], [3, 16]]) #3a

        self.inception_3b = Inception_base(1, 80, [[40], [32,48], [12, 16], [3, 16]]) #3b

        self.max_pool_inc3= nn.MaxPool2d(kernel_size=3, stride=2, padding=0)

        self.inception_5a = Inception_base(1, 120, [[40], [32,48], [12, 16], [3, 16]]) #5a

        self.inception_5b = Inception_base(1, 120, [[40], [32,48], [12, 16], [3, 16]]) #5b

        self.avg_pool5 = nn.AvgPool2d(kernel_size=3, stride=2, padding=0)

        self.dropout_layer = nn.Dropout(0.4)

        self.fc = nn.Linear(120*9, num_classes)

引用

[1] https://github.com/yunjey/pytorch-tutorial/tree/master/tutorials/02-intermediate/deep_residual_network/main.py

[2] https://github.com/pytorch/vision/blob/master/torchvision/models/vgg.py

[3] https://github.com/pytorch/vision/blob/master/torchvision/models/resnet.py

[4] https://github.com/antspy/inception_v1.pytorch/blob/master/inception_v1.py

比较 VGG, resnet和inception的图像分类效果的更多相关文章

NASNet学习笔记—— 核心一：延续NAS论文的核心机制使得能够自动产生网络结构；核心二：采用resnet和Inception重复使用block结构思想；核心三：利用迁移学习将生成的网络迁移到大数据集上提出一个new search space。
from:https://blog.csdn.net/xjz18298268521/article/details/79079008 NASNet总结论文:<Learning Transfer ...
学习TensorFlow，调用预训练好的网络（Alex, VGG, ResNet etc）
视觉问题引入深度神经网络后,针对端对端的训练和预测网络,可以看是特征的表达和任务的决策问题(分类,回归等).当我们自己的训练数据量过小时,往往借助牛人已经预训练好的网络进行特征的提取,然后在后面加上自 ...
Keras入门（五）搭建ResNet对CIFAR-10进行图像分类
本文将会介绍如何利用Keras来搭建著名的ResNet神经网络模型,在CIFAR-10数据集进行图像分类. 数据集介绍 CIFAR-10数据集是已经标注好的图像数据集,由Alex Krizhe ...
论文笔记：CNN经典结构1（AlexNet，ZFNet，OverFeat，VGG，GoogleNet，ResNet）
前言本文主要介绍2012-2015年的一些经典CNN结构,从AlexNet,ZFNet,OverFeat到VGG,GoogleNetv1-v4,ResNetv1-v2. 在论文笔记:CNN经典结构2 ...
图像分类丨Inception家族进化史「GoogleNet、Inception、Xception」
引言 Google提出的Inception系列是分类任务中的代表性工作,不同于VGG简单地堆叠卷积层,Inception重视网络的拓扑结构.本文关注Inception系列方法的演变,并加入了Xcept ...
1、VGG16 2、VGG19 3、ResNet50 4、Inception V3 5、Xception介绍——迁移学习
ResNet, AlexNet, VGG, Inception: 理解各种各样的CNN架构本文翻译自ResNet, AlexNet, VGG, Inception: Understanding va ...
深度学习笔记（十一）网络 Inception, Xception, MobileNet, ShuffeNet, ResNeXt, SqueezeNet, EfficientNet, MixConv
1. Abstract 本文旨在简单介绍下各种轻量级网络,纳尼?!好吧,不限于轻量级 2. Introduction 2.1 Inception 在最初的版本 Inception/GoogleNet, ...
PyTorch ResNet 使用与源码解析
本章代码:https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson8/resnet_inference.py 这篇文章首先会简 ...
【深度学习】keras + tensorflow 实现猫和狗图像分类
本文主要是使用[监督学习]实现一个图像分类器,目的是识别图片是猫还是狗. 从[数据预处理]到 [图片预测]实现一个完整的流程, 当然这个分类在 Kaggle 上已经有人用[迁移学习](VGG,Resn ...

随机推荐

Nginx 配置支持 WebSocket
找到nginx的配置文件:nginx.conf,增加以下三行配置. 示例: server { listen 80; server_name www.test.com; location / { pro ...
Java Collection集合方法
一.简单方法 package cn.itcast.day15; import java.util.ArrayList; import java.util.Arrays; import java.uti ...
Javaweb学习(三)：Servlet程序
好了,既然开发环境已经配置好了.那么我们首先要搞定得便是servlet了,至于为什么不先去研究jsp,这是因为jsp与servlet本就是一体两面,jsp其本身经过编译.载入.转化等步骤最终会成为se ...
当DATABASE进入了suspect模式以后
一个VM的错误就造成了sql2012的脱序.很多一般看不到的模式陆续登场诸如 recovery pending, suspect, EMERGENCY. 以下脚本可以帮助恢复,如果文件没有损坏的话. ...
Java实现XML和JavaBean互转 - XStream
1.简介 XStream是一个序列化JavaBean为XML文件以及反序列化的工具. 2.准备 2.1.XML回顾在学习这部分内容前,假设你对XML以及有一定的了解,至少能够分辨出XML的元素.属性 ...
php 两个二维数组重组新数组，数组下标不同
Array ( [0] => Array ( [PosNum] => 27025008 [start_time] => 20180328164929 [type] => 0 ) ...
android camera 摄像头预览画面变形
问题:最近在处理一下camera的问题,发现在竖屏时预览图像会变形,而横屏时正常.但有的手机则是横竖屏都会变形. 结果:解决了预览变形的问题,同时支持前后摄像头,预览无变形,拍照生成的jpg照片方向正 ...
或许因为缺少默认route配置而导致的的ping超慢，甚至timeout
内网有台dell r620 做测试用: 4个网口都插了网线,通过小交换直接连在中心路由的第3个口上: 安装了kvm,有virbr0 :但还没装其它的虚拟机. ping 外网域名 ,IP地址都超 ...
STlinkSWD模式连线方式
若使用SWD模式,则只需要连接4根线,7,9,20,1即SWDIO,SWDCLK,GND,VCC.VCC为3.3V
Python2.7-robotparser
robotparser 模块,用于解析网站的 robots.txt 文件,robots.txt 文件是用于指定搜索引擎爬虫的访问权限的,此模块在 python3 中重命名为 urllib.robotp ...