【DL论文精读笔记】AlexNet

黑芒猩 2024-10-21 03:05:28 原文

1.1引言

1.2数据集

就是ImageNet，当时计算机视觉最大的数据集

1.3结构

采用双GPU结构实现，并行处理图像，2-3,5-全连接部分中间还将特征图共享

最后全连接层输出的4096的语义信息具有重大意义，为之后的分类等做奠基

1.4.避免过拟合

1.4.1 数据增强

● 把图片人工变大，256x256随机截取224x224出来

● 在通道上做变换，使得颜色不一样

因为卷积对图片的位置、光照、颜色等信息是比较敏感的，做变换之后，记住数据的能力变低

1.4.2 Dropout

作者认为dropout是模型融合，但如今大家觉得dropout是一个正则的东西

如果没有dropout放在前面两个全连接上，实验表明没有dropout过拟合严重

1.5.训练细节

● 使用SGD来训练，momenum

● 权重是使用均值为0，方差为0.01高斯随机变量来初始化

● 2、4、5层偏移初始化为1，其他为0。（然并卵，目前采用全部初始化为0）

● 每个层用同样的学习率，从0.01开始，如果验证误差不往下降，就x10，但是后来不用这个做法，主流做法是每多少epoch下降一点。

Alexnet是蓝色曲线，目前主流算法用平滑的下降方式，比如cos函数则是红色曲线

● 需要5-6天在两个NIVIDIA GTX 580 3GB的GPU训练

1.6.实验

最重要的部分，就是一些数据对比。具体实验怎么做不用太关心细节，看结果

实验在完整的数据集上进行了训练，沐神说现在很少有人去完整的数据集上训练了，但是完整的数据集质量会更好。

重点：

他在两个gpu上训练，发现在gpu1上发现的是与颜色无关的特征，而gpu2则是颜色相关，目前也不能解释。

对神经网络的可视化，做出了一些工作，对神经网络的学习内容有了一些直观的了解。但是目前人们仍然不知道神经网络到底在学些什么，可解释性差

【DL论文精读笔记】AlexNet的更多相关文章

【深度学习论文篇 02-1 】YOLOv1论文精读
原论文链接:https://gitee.com/shaoxuxu/DeepLearning_PaperNotes/blob/master/YOLOv1.pdf 笔记版论文链接:https://gite ...
论文学习笔记 - 高光谱和 LiDAR 融合分类合集
A³CLNN: Spatial, Spectral and Multiscale Attention ConvLSTM Neural Network for Multisource Remote Se ...
Visualizing and Understanding Convolutional Networks论文复现笔记
目录 Visualizing and Understanding Convolutional Networks 论文复现笔记 Abstract Introduction Approach Visual ...
论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...
论文阅读笔记 - Mesos: A Platform for Fine-Grained ResourceSharing in the Data Center
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...
论文阅读笔记 Word Embeddings A Survey
论文阅读笔记 Word Embeddings A Survey 收获 Word Embedding 的定义 dense, distributed, fixed-length word vectors, ...
论文阅读笔记 Improved Word Representation Learning with Sememes
论文阅读笔记 Improved Word Representation Learning with Sememes 一句话概括本文工作使用词汇资源--知网--来提升词嵌入的表征能力,并提出了三种基于 ...
GoogLeNetv4 论文研读笔记
Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning 原文链接摘要向传统体系结构中引入 ...
GoogLeNetv3 论文研读笔记
Rethinking the Inception Architecture for Computer Vision 原文链接摘要卷积网络是目前最新的计算机视觉解决方案的核心,对于大多数任务而言,虽 ...
GoogLeNetv2 论文研读笔记
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 原文链接摘要 ...

随机推荐

shell脚本自动化部署Zabbix4.2（修改脚本替换版本）
#!/bin/bash # 检查操作系统版本,该脚本只能运行在 Centos 7.x 系统上 cat /etc/redhat-release |grep -i centos |grep '7.[[:d ...
关于Ubuntu系统无法输入中文的问题，即使做了种种修改
原网址:https://shurufa.sogou.com/linux/guide 在经历一晚上一及一下午的奋战后,找到了最终解决方案,该解决方案使用的是搜狗输入法在操作之前有以下注意事项:所有操作 ...
Redis变慢？深入浅出Redis性能诊断系列文章(一)
(本文首发于"数据库架构师"公号,订阅"数据库架构师"公号,一起学习数据库技术) Redis 作为一款业内使用率最高的内存数据库,其拥有非常高的性能,单节点 ...
Docker(一)：初识
1.什么是Docker Docker 是一个基于Go 语言并遵从Apache2.0协议开源的.轻量级的容器引擎,主要运行于 Linux 和 Windows,用于创建.管理和编排容器.可以让开发者打 ...
（数据科学学习手札142）dill：Python中增强版的pickle
本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介大家好我是费老师,相信不少读者朋友们都在Pyth ...
ProxySQL(8)：SQL语句的重写规则
文章转载自: https://www.cnblogs.com/f-ck-need-u/p/9309760.html 为什么要重写SQL语句 ProxySQL在收到前端发送来的SQL语句后,可以根据已定 ...
CentOS7使用yum方式安装Containerd
# 安装需要的软件包, yum-util 提供yum-config-manager功能,另外两个是devicemapper驱动依赖的 yum install -y yum-utils device-m ...
常用的清理 Kubernetes 集群资源命令
1. Kubernetes 基础对象清理清理 Evicted 状态的 Pod kubectl get pods --all-namespaces -o wide | grep Evicted | a ...
常见Content-Type（MIME）列表
Content-Type(MIME)用于标识发送或接收数据的类型,浏览器根据该参数来决定数据的打开方式.多用于指定一些客户端自定义的文件,以及一些媒体文件的打开方式. 文件扩展名 Content-Ty ...
2022IDEA破解
注意本教程适用于 IntelliJ IDEA 2022.1.2 以下所有版本,请放心食用~ 本教程适用于 JetBrains 全系列产品,包括 IDEA.Pycharm.WebStorm.Phpst ...