两层全连接神经网络的内容要比想象中的多很多,代码量也很多,在cs231n只用了15分钟讲解的东西我用了一周半的时间才完全的消化理解,这周终于完成了全连接神经网络博客的书写https://www.cnblogs.com/Lbmttw/p/16858127.html,两层全连接神经网络的结构是输入层-----隐藏层-----激活函数层-----输出层,其实本质我们要寻求的东西是一样的,都是要寻找分数函数,并且要求损失函数最小,不过我们原本是将整个输入层经过一层处理得到分数函数,不过在神经网络中,我们要经过多层,在后面的卷积神经网络中甚至还有卷积层和池化层;多了隐藏层相当于我们多处理了图像中的特点,隐藏层多了相当于学习能力变强了,隐藏层中节点的个数可以看做学习到的特征的数量。所以在经过一个两层全连接神经网络后我们的模型学习能力变强,准确率相应的也会升高。在两层全连接网络中,分类任务的准确率提高到了50%左右。

全连接网络的训练速度特别缓慢,我在Google drive上枚举寻找最优参数的过程中用时将近3个小时才找到最优的参数,训练出一个最优的模型,但是这个模型仍然存在过拟合的问题,减小过拟合可以通过增大正则项,减少隐藏层的神经元个数来实现,显然,减小神经元的个数相当于降低了机器的学习能力,也就能避免过拟合,但是一定要注意,如果隐藏层的数目过小可能会导致学习能力过低从而测试集准确率反而下降的现象,所以如何设定隐藏层的神经元个数值得我们商榷。

本周的困难主要出在对于神经网络这一模型的认知上,我之前始终不明白神经网络模型弄了那么多层是在干什么,每一层具体的物理意义是什么,在听完CNN的课后忽然就有一点明白了,本质都是一样的,在寻求分数函数并且损失函数最小化进而通过每一个类的分数来确定测试集到底属于哪一类,将所有性质一窝蜂似的大杂烩显然不能很好的学习模型的特性,相反的,通过不同层之间相互的映射,便可以逐层学习到模型不一样的特征,包括接下来要弄的CNN中的卷积层也是同样的道理,卷积核不断的移动,得到不同局部的性质,然后再通过局部性质合成成整张照片。目前的进度稍稍有点慢了,但是是我有意为之,神经网络的博客的工作量赶得上之前所有博客之和还要多,所以为了让自己理解明白并且能说明白这件事情,还是用了很多的心思的。下一周的任务是卷积神经网络的实现以及NeRF(神经辐射场)的综述部分,打算好好写一下综述,并且想要投一下试试看,亲身体验一下投paper的感觉。

cv学习总结(11.6-11.13)的更多相关文章

  1. c++学习书籍推荐《深入理解C++11 C++11新特性解析与应用》下载

    百度云及其他网盘下载地址:点我 编辑推荐 <深入理解C++11:C++11新特性解析与应用>编辑推荐:C++标准委员会成员和IBM XL编译器中国开发团队共同撰写,权威性毋庸置疑.系统.深 ...

  2. Kafka 学习笔记之 Kafka0.11之console-producer/console-consumer

    Kafka 学习笔记之 Kafka0.11之console-producer/console-consumer: 启动Zookeeper 启动Kafka0.11 创建一个新的Topic: ./kafk ...

  3. Qt 学习之路 2(13):对话框简介

    Qt 学习之路 2(13):对话框简介  豆子  2012年9月14日  Qt 学习之路 2  53条评论 对话框是 GUI 程序中不可或缺的组成部分.很多不能或者不适合放入主窗口的功能组件都必须放在 ...

  4. [源码解析] 深度学习分布式训练框架 horovod (13) --- 弹性训练之 Driver

    [源码解析] 深度学习分布式训练框架 horovod (13) --- 弹性训练之 Driver 目录 [源码解析] 深度学习分布式训练框架 horovod (13) --- 弹性训练之 Driver ...

  5. 2016年11月11日 星期五 --出埃及记 Exodus 20:2

    2016年11月11日 星期五 --出埃及记 Exodus 20:2 "I am the LORD your God, who brought you out of Egypt, out o ...

  6. System.Thread.TImer控件——http://www.360doc.com/content/11/0812/11/1039473_139824496.shtml

    http://www.360doc.com/content/11/0812/11/1039473_139824496.shtml

  7. Ubuntu 10.10, 11.04, 11.10这三个版本无法从优盘启动

    问题:Ubuntu 10.10, 11.04, 11.10这三个版本无法从优盘启动 解决:从U盘启动安装的时候,会卡住不动.搞定办法相当简单,修改syslinux/syslinuxfg文件:将defa ...

  8. iOS 11.2 - 11.3.1 越狱教程

    iOS 11.2 - 11.3.1 越狱教程 一.准备相应的工具 (1) 下载 CydiaImpactor,官网地址是 http://cydiaImpactor.com (2) 下载 Electra, ...

  9. 201771010126 王燕《面向对象程序设计(Java)》第十四周学习总结(测试程序11)

    实验十四  Swing图形界面组件 理论部分: 不使用布局管理器 有时候可能不想使用任何布局管理器,而只 是想把组件放在一个固定的位置上.下面是将一 个组件定位到某个绝对定位的步骤: 1)将布局管理器 ...

  10. (原+转)ubuntu16中安装opencv2.4.11(2.4.13)

    转载请注明出处: http://www.cnblogs.com/darkknightzh/p/5638117.html 参考网址: http://www.cnblogs.com/jeakon/arch ...

随机推荐

  1. JAVA数据类型以及什么是字节

    强类型语言:要求变量的使用要严格符合规定,所有变量都必须先定义才能使用(安全性高) java的数据类型分为两大类 基本类型(primitive type) 引用类型(reference type) / ...

  2. RPC通信原理概述

    RPC通信原理概述 1.RPC概述 1.什么是RPC RPC(Remote Procedure Call Protocol)远程过程调用协议.它是一种通过网络从远程计算机程序上请求服务,而不需要了解底 ...

  3. Markdown 的常用语法

    声明(叠甲):鄙人水平有限,本文章仅供参考. 且本文章是一个不全的分享,只有我目前用的比较多的语法,如果有什么错误,欢迎大家指正.具体可以查看该网站 写博客我使用的是 Markdown,为熟悉 Mar ...

  4. 记录关于Chromium系浏览器密码安全问题的一些思考

    首先就是在此之前就看到有相关报道讲到Chrome等浏览器密码都在本地明文存储,而且权限要求很低,任何程序都可以随意读取,这方面的安全问题暂且不表. 今天使用Edge时候发现浏览器储存的密码,在我已经设 ...

  5. ML-程序练习-Dragon

    回归问题 前期 假设已有某样例,参数为w=1.477, b=0.089,即为\(y=1.477x+0.089\) 过程分析 数据采样 首先我们需要模拟一些带有真实样本观测误差的数据(因为真实情况是真实 ...

  6. WebDriver API及对象识别技术

    html页面的iframe的切换: iframe框架在html页面:实际就是多个html页面的相互嵌套:如果存在多个,则操作对象一直停留在主文档页面:    如果需要操作子文档页面则需要实现ifram ...

  7. [设计模式/网络/WebServer/Nginx]设计模式之代理模式(网络代理 : 正向代理与反向代理)【7】

    1 代理模式 1.1 模式定义 代理模式(Proxy Pattern):为其他对象提供一种代理服务以对这个被代理的对象进行控制访问.[ 设计模式.面向对象程序设计思想的鼻祖----GoF] Subje ...

  8. Docker容器网络(基本网络模型)

    解析Docker的4种容器网络 默认网络模型 先介绍默认的网络模型: 安装docker后,输入ifconfig就会发现多了网卡中多了一个docker0: $ ifconfig docker0: fla ...

  9. 12-提取css成单独文件

    const { resolve } = require('path') const HtmlWebpackPlugin = require('html-webpack-plugin') const M ...

  10. 如何将 Spire.Doc for C++ 集成到 C++ 程序中

    Spire.Doc for C++是一个专业的 Word 库,供开发人员在任何类型的 C++ 应用程序中阅读.创建.编辑.比较和转换 Word 文档. 本文演示了如何以两种不同的方式将 Spire.D ...