【项目实战】CNN手写识别复杂模型的构造

感谢视频教程：https://www.bilibili.com/video/BV1Y7411d7Ys?p=11

这里开一篇新博客不仅仅是因为教程视频单独出了1p，也是因为这是一种代码编写的套路，特在此做下记录。

这里我们的模型构造采用如下图示

分为一个1x1池化层,然后一个1x1卷积层输出为16通道，一个先1x1卷积再5x5卷积输出为24通道，最后一个1x1卷积和两个3x3卷积后输出为24通道，这四个卷积层最后合并在一起输出。至于为什么会有1x1卷积核，是因为这样转换通道数的时候可以大大的简化计算步骤，减少代码运行时间

具体的代码设计如下

在昨天的代码基础上，首先由于模型较为复杂，所以我们单独写出一个函数，减少代码的冗余

class InceptionA(nn.Module):

    def __init__(self, in_channels):         # 每一部分都分开编写

        super(InceptionA, self).__init__()

        self.branch1x1 = nn.Conv2d(in_channels, 16, kernel_size=1)

        self.branch5x5_1 = nn.Conv2d(in_channels, 16, kernel_size=1)

        self.branch5x5_2 = nn.Conv2d(16, 24, kernel_size=5, padding=2) # 因为希望输出的图像大小不变，所以用padding补零

        self.branch3x3_1 = nn.Conv2d(in_channels, 16 ,kernel_size=1)

        self.branch3x3_2 = nn.Conv2d(16, 24, kernel_size=3, padding=1)

        self.branch3x3_3 = nn.Conv2d(24, 24, kernel_size=3, padding=1)

        self.branch_pool = nn.Conv2d(in_channels, 24, kernel_size=1)

    def forward(self, x):

        branck1x1 = self.branch1x1(x)

        branck5x5 = self.branch5x5_1(x)

        branck5x5 = self.branch5x5_2(branck5x5)

        branck3x3 = self.branch3x3_1(x)

        branck3x3 = self.branch3x3_2(branck3x3)

        branck3x3 = self.branch3x3_3(branck3x3)

        branch_pool = F.avg_pool2d(x, kernel_size=3, stride=1, padding=1)

        branch_pool = self.branch_pool(branch_pool)

        outputs = [branck1x1, branck5x5, branck3x3, branch_pool]

        return torch.cat(outputs, dim=1)  #这里把维度降为1

然后我们再构建模型即可

class Net(torch.nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        self.conv1 = torch.nn.Conv2d(1, 10, kernel_size=5)

        self.conv2 = torch.nn.Conv2d(88, 20, kernel_size=5)  # 88=24x3+16

        self.incep1 = InceptionA(in_channels=10)

        self.incep2 = InceptionA(in_channels=20)

        self.mp = nn.MaxPool2d(2)   # 这里的2是也是由模型计算出来的

        self.fc = nn.Linear(1408, 10)  # 真正的工作中这里的1408并不需要我们自己去算

    def forward(self, x):

        in_size = x.size(0)

        x = F.relu(self.mp(self.conv1(x)))

        x = self.incep1(x)

        x = F.relu(self.mp(self.conv2(x)))

        x = self.incep2(x)

        x = x.view(in_size, -1)

        x = self.fc(x)

        return x

``

【项目实战】CNN手写识别复杂模型的构造的更多相关文章

【项目实战】CNN手写识别
由于只需要修改之前基于ANN模型代码的模型设计部分所以篇幅较短,简单的加点注释给自己查看即可视频链接:https://www.bilibili.com/video/BV1Y7411d7Ys?p=10 ...
AI应用开发实战 - 手写识别应用入门
AI应用开发实战 - 手写识别应用入门手写体识别的应用已经非常流行了,如输入法,图片中的文字识别等.但对于大多数开发人员来说,如何实现这样的一个应用,还是会感觉无从下手.本文从简单的MNIST训练出 ...
（五） Keras Adam优化器以及CNN应用于手写识别
视频学习来源 https://www.bilibili.com/video/av40787141?from=search&seid=17003307842787199553 笔记 Adam,常 ...
TensorFlow 入门之手写识别CNN 三
TensorFlow 入门之手写识别CNN 三 MNIST 卷积神经网络 Fly 多层卷积网络多层卷积网络的基本理论构建一个多层卷积网络权值初始化卷积和池化第一层卷积第二层卷积密集层连接 ...
android 开源 OCR 项目及手写识别
http://blog.csdn.net/archfree/article/details/6023676 1)一个为Android平台,将识别由手机的相机拍摄的图像文本应用程序. http://co ...
机器学习实战kNN之手写识别
kNN算法算是机器学习入门级绝佳的素材.书上是这样诠释的:“存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都有标签,即我们知道样本集中每一条数据与所属分类的对应关系.输入没有标签的新数据 ...
(手写识别) Zinnia库及其实现方法研究
Zinnia库及其实现方法研究 (转) zinnia是一个开源的手写识别库.采用C++实现.具有手写识别,学习以及文字模型数据制作转换等功能. 项目地址 [http://zinnia.sourcefo ...
tensorflow笔记（四）之MNIST手写识别系列一
tensorflow笔记(四)之MNIST手写识别系列一版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...
tensorflow笔记（五）之MNIST手写识别系列二
tensorflow笔记(五)之MNIST手写识别系列二版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...

随机推荐

Unity3D学习笔记7——GPU实例化(2)
目录 1. 概述 2. 详论 2.1. 实现 2.2. 解析 3. 参考 1. 概述在上一篇文章<Unity3D学习笔记6--GPU实例化(1)>详细介绍了Unity3d中GPU实例化的 ...
要想不踩SaaS那些坑，得先了解“SaaS架构”
摘要:围绕当下许多企业青睐的SaaS应用开发,华为云开发者技术服务工程师程泽在DTT首期带来主题为 <SaaS云原生应用典型架构> 的DTT首期直播分享. 本文分享自华为云社区<DT ...
Solution -「校内题」矩阵求和
Description 共 \(T\) 组数据.对于每组数据,给定 \(a, b, n\),求 \(\sum_{i = 1}^{n} \sum_{j = 1}^{n} \gcd(a^i - b^i, ...
Centos7借助docker部署mysql,提供远程链接服务
Centos7 借助docker部署mysql,并提供远程连接服务安装docker 运行docker 注意安装docker和运行docker的步骤很简单,可以参考我学习docker的笔记 docke ...
NOI / 2.1基本算法之枚举题解-1（3861字）制作不易
目录 1.15 Counterfeit Dollarhttp://noi.openjudge.cn/ch0201/15/ 2.1749 数字方格
水电表/燃气表/压力表/传感器/仪器仪表等，超低功耗段码LCD液晶显示驱动IC-VKL144A/B 超低工作电流，36*4COM显示，替代PCF8551/MCP144/BU9792/9B92/BL55072B等
煤气罐的使用安全隐患较大,现在大部分城市使用管道输送燃气,燃气表的计费大都是通过远程抄表的方式,或者充值的方式,为了让用户更好地了解自家燃气表的使用情况,需要一款液晶屏来显示燃气表的状态和用气量等信息 ...
Linux系统上传公钥不生效问题
Authentication refused: bad ownership or modes for file /home/yanbo.xu/.ssh/authorized_keys 原因: sshd ...
HashSet集合的介绍和哈希值
java.util.Set接口 extends Collection接口 Set接口的特点: 1.不允许存储重复的元素 2.没有索引,没有带索引的方法,也不能使用普通的for循环遍历 java.uti ...
[eJOI2019]异或橙子题解
简要题面维护一个数据结构,支持单点修改,询问区间所有子区间的异或和的异或和 . 做法首先,题目要求所有子区间的异或和的异或和,发现每个元素异或两次就变成 \(0\),所以考虑统计每个元素出现的次数 ...
ExcelPatternTool: Excel表格-数据库互导工具
ExcelPatternTool Excel表格-数据库互导工具介绍: 指定Pattern文件-一个规则描述的json文档,基于此规则实现Excel表格与数据库之间的导入导出,校验等功能. 特点: ...

【项目实战】CNN手写识别复杂模型的构造

【项目实战】CNN手写识别复杂模型的构造的更多相关文章

随机推荐

热门专题