两层全连接神经网络的内容要比想象中的多很多,代码量也很多,在cs231n只用了15分钟讲解的东西我用了一周半的时间才完全的消化理解,这周终于完成了全连接神经网络博客的书写https://www.cnblogs.com/Lbmttw/p/16858127.html,两层全连接神经网络的结构是输入层-----隐藏层-----激活函数层-----输出层,其实本质我们要寻求的东西是一样的,都是要寻找分数函数,并且要求损失函数最小,不过我们原本是将整个输入层经过一层处理得到分数函数,不过在神经网络中,我们要经过多层,在后面的卷积神经网络中甚至还有卷积层和池化层;多了隐藏层相当于我们多处理了图像中的特点,隐藏层多了相当于学习能力变强了,隐藏层中节点的个数可以看做学习到的特征的数量。所以在经过一个两层全连接神经网络后我们的模型学习能力变强,准确率相应的也会升高。在两层全连接网络中,分类任务的准确率提高到了50%左右。

全连接网络的训练速度特别缓慢,我在Google drive上枚举寻找最优参数的过程中用时将近3个小时才找到最优的参数,训练出一个最优的模型,但是这个模型仍然存在过拟合的问题,减小过拟合可以通过增大正则项,减少隐藏层的神经元个数来实现,显然,减小神经元的个数相当于降低了机器的学习能力,也就能避免过拟合,但是一定要注意,如果隐藏层的数目过小可能会导致学习能力过低从而测试集准确率反而下降的现象,所以如何设定隐藏层的神经元个数值得我们商榷。

本周的困难主要出在对于神经网络这一模型的认知上,我之前始终不明白神经网络模型弄了那么多层是在干什么,每一层具体的物理意义是什么,在听完CNN的课后忽然就有一点明白了,本质都是一样的,在寻求分数函数并且损失函数最小化进而通过每一个类的分数来确定测试集到底属于哪一类,将所有性质一窝蜂似的大杂烩显然不能很好的学习模型的特性,相反的,通过不同层之间相互的映射,便可以逐层学习到模型不一样的特征,包括接下来要弄的CNN中的卷积层也是同样的道理,卷积核不断的移动,得到不同局部的性质,然后再通过局部性质合成成整张照片。目前的进度稍稍有点慢了,但是是我有意为之,神经网络的博客的工作量赶得上之前所有博客之和还要多,所以为了让自己理解明白并且能说明白这件事情,还是用了很多的心思的。下一周的任务是卷积神经网络的实现以及NeRF(神经辐射场)的综述部分,打算好好写一下综述,并且想要投一下试试看,亲身体验一下投paper的感觉。

cv学习总结(11.6-11.13)的更多相关文章

  1. c++学习书籍推荐《深入理解C++11 C++11新特性解析与应用》下载

    百度云及其他网盘下载地址:点我 编辑推荐 <深入理解C++11:C++11新特性解析与应用>编辑推荐:C++标准委员会成员和IBM XL编译器中国开发团队共同撰写,权威性毋庸置疑.系统.深 ...

  2. Kafka 学习笔记之 Kafka0.11之console-producer/console-consumer

    Kafka 学习笔记之 Kafka0.11之console-producer/console-consumer: 启动Zookeeper 启动Kafka0.11 创建一个新的Topic: ./kafk ...

  3. Qt 学习之路 2(13):对话框简介

    Qt 学习之路 2(13):对话框简介  豆子  2012年9月14日  Qt 学习之路 2  53条评论 对话框是 GUI 程序中不可或缺的组成部分.很多不能或者不适合放入主窗口的功能组件都必须放在 ...

  4. [源码解析] 深度学习分布式训练框架 horovod (13) --- 弹性训练之 Driver

    [源码解析] 深度学习分布式训练框架 horovod (13) --- 弹性训练之 Driver 目录 [源码解析] 深度学习分布式训练框架 horovod (13) --- 弹性训练之 Driver ...

  5. 2016年11月11日 星期五 --出埃及记 Exodus 20:2

    2016年11月11日 星期五 --出埃及记 Exodus 20:2 "I am the LORD your God, who brought you out of Egypt, out o ...

  6. System.Thread.TImer控件——http://www.360doc.com/content/11/0812/11/1039473_139824496.shtml

    http://www.360doc.com/content/11/0812/11/1039473_139824496.shtml

  7. Ubuntu 10.10, 11.04, 11.10这三个版本无法从优盘启动

    问题:Ubuntu 10.10, 11.04, 11.10这三个版本无法从优盘启动 解决:从U盘启动安装的时候,会卡住不动.搞定办法相当简单,修改syslinux/syslinuxfg文件:将defa ...

  8. iOS 11.2 - 11.3.1 越狱教程

    iOS 11.2 - 11.3.1 越狱教程 一.准备相应的工具 (1) 下载 CydiaImpactor,官网地址是 http://cydiaImpactor.com (2) 下载 Electra, ...

  9. 201771010126 王燕《面向对象程序设计(Java)》第十四周学习总结(测试程序11)

    实验十四  Swing图形界面组件 理论部分: 不使用布局管理器 有时候可能不想使用任何布局管理器,而只 是想把组件放在一个固定的位置上.下面是将一 个组件定位到某个绝对定位的步骤: 1)将布局管理器 ...

  10. (原+转)ubuntu16中安装opencv2.4.11(2.4.13)

    转载请注明出处: http://www.cnblogs.com/darkknightzh/p/5638117.html 参考网址: http://www.cnblogs.com/jeakon/arch ...

随机推荐

  1. DVWA-SQL Injection(SQL注入)

    SQL Injection,是指攻击者通过注入恶意的SQL命令,破坏SQL查询语句的.结构,从而达到执行恶意SQL语句的目的. LOW: 代码审计: SQL Injection Source vuln ...

  2. java 面向对象 --static

    java 面向对象 --static package charpter5.Demo09; //static public class Student { private static int age; ...

  3. spark中的持久化机制以及lineage和checkpoint(简含源码解析)

    spark相比MapReduce最大的优势是,spark是基于内存的计算模型,有的spark应用比较复杂,如果中间出错了,那么只能根据lineage从头开始计算,所以为了避免这种情况,spark提供了 ...

  4. 有了HTTP,为啥还要用RPC

    既然有 HTTP 请求,为什么还要用 RPC 调用? 一直以来都没有深究过RPC和HTTP的区别,不都是写一个服务然后在客户端调用么? HTTP和RPC最本质的区别,就是 RPC 主要是基于 TCP/ ...

  5. MQ(消息队列)常见问题梳理

    MQ 中 broker 的作用,有无broker有什么差异? MQ(Message Queue)中的broker是消息队列的核心组件之一,它的作用是接收.存储.分发和传递消息.具体来说,broker主 ...

  6. Flask框架cbv的写法、请求与响应、请求扩展、session源码分析、闪现

    本篇文章将会详细讲在flask框架如何写cbv.请求与响应.请求扩展.session源码分析.闪现等知识点. 目录 一.flask写CBV 二.请求与响应 三.session 四.闪现flash 五. ...

  7. 你绝对没想到的GPT的底层意义

    学会说话才是完整的人 有种说法在民间流传已久,在某些非洲部落中,孩子出生后往往会被称作"小人"或者"半个人",直到他们能够进行语言的交流才被认为是完全的人.这是 ...

  8. TOP使用参数

    TOP使用参数top是检查机器当前运行状况的第一个命令,就好比是机器体检时的第一张报告单.先了解一下TOP命令的使用 [root@localhost /]# top -help top: procps ...

  9. 扯下@EventListener这个注解的神秘面纱。

    你好呀,我是歪歪. 前段时间看到同事在项目里面使用了一个叫做 @EventListener 的注解. 在这之前,我知道这个注解的用法和想要达到的目的,但是也仅限于此,其内部工作原理对我来说是一个黑盒, ...

  10. 版本依赖控制工具Maven

    Maven 简介 依赖管理工具 如果说A工程里面用到了B工程的类.接口.配置文件等这样的资源,那么就说A依赖B 构建管理工具 构建:使用原材料生产产品的过程 安装:把一个Maven工程经过打包操作生产 ...