100天搞定机器学习|Day35 深度学习之神经网络的结构

本文为3Blue1Brown之《What is a Neural Network?》学习笔记

观看地址：bilibili.com/video/av15532370

这集Grant大佬假设大家都没有神经网络的基础，为新手讲解神经网络基本概念，让大家再听说神经网络学习的时候，可以明白究竟是什么意思。大佬选择经典的多层感知器（MLP）结构解决手写数字识别问题，理由是理解了经典原版，才能更好地理解功能强大的变种，比如CNN和LSTM。

首先看看神经元和他们是怎么连接的

神经元可以理解为一个装着0到1之间数字的容器。以28*28输入图像每一个像素为例，每一个原点都是一个神经元，其中数字代表对于像素的灰度值，0表示纯黑，1表示纯白，这个数字在神经网络里称作“激活值”。

这784个神经元就组成了网络的第一层，最后一层的十个神经元代表0-9这十个数，同样的，他们的激活值也在0-1之间，代表了输入图像对应哪个数字的可能性。网络中间层被称为隐含层，可以看做黑箱，数字识别的具体工作就在这里完成，这里加了两层隐含层，每层有16个神经元——随便设置的，只是为了显得好看，后期还可以再调整。

神经网络处理信息的核心机制正是如此，一层的激活值通过一定的运算，得出下一层的激活值。上面也提到784个神经元代表的是数字图案，那么下一层激活值也会产生某些特殊的图案，最终在输出层最亮的神经元表示神经网络的选择。

我们再看看如何训练，为什么这种层状结构就能识别数字呢？

我们可以把数字进行拆解，理想状况下希望倒数第二层的各个神经元可以分别对应上一个笔画。

再来看隐含层第一层，当输入为9或8的上面带圈的数字时，某个神经元的激活值就会接近1，希望所有这种位于图像顶部的圆圈图案都能点亮这个神经元，这样，从第三次到输出层，我们只需要学习哪些部件能组合出哪个数字即可。

但是如何识别圆圈呢？同理可以把它拆分成更细微的问题。

于是我们希望网络第二层的各个神经元对应这些短边，第二层就能把所有关联短边的八到十个神经元都点亮，接着就能点亮对于顶部圆圈和长竖条的神经元。

然后我们看看连线的作用

如何让第二层（隐含层的第一层）中的这一个神经元能够能够识别出图像的这一块区域是否存在一条边？

我们设计让第二层的某一个神经元能正确识别图像中的这块区域里是否存在一条边。

我们拿出第一层（输入层/第0层）的激活值，并赋上权重（要关注区域的权重为正值，否则为0），这样对所有像素值求加权和，就只会累加关注区域的像素值了。

绿色为正值，红色为负值，颜色越暗表示权重越接近0

所以想要识别是否存在一条边，只需要给周围一圈的像素都赋予负权重

计算的加权值可以使任意大小的

但是我们需要的是将其压缩到0-1之间

这里就需要Sigmoid函数了，这就是激活函数。

激活值实际上就是一个对加权之和到底有多正的打分，但是有时加权之和大于0时，也不想点亮神经元，比如想要加权和大于10时才让他激发，这里就还需要加上一个偏置值，保证不随便激发。

权重告诉我们第二个神经元关注什么样的像素图案

bias告诉我们加权和要多大才能让神经元的激发有意义

这里有13000多个参数需要调整，所以这里所谓的学习就是找到正确的权重和偏置。刚开始讲到我们把神经元看作是数字容器，但是这些数字取决于输入的图像，所以把神经元看过一个函数才更准确，它的输入是上一层所有神经元的输出，它的输出是一个0-1之间的值。其实整个神经网络也是一个函数，输入784个值，输出10个值。不过它是一个包含了13000个权重、偏置参数的极其复杂的函数。

需要注意的是，机器学习尤其是神经网络运算与线性代数是密不可分的，之前有过介绍，请移步：

100天搞定机器学习|Day26-29 线性代数的本质

神经网络中需要大量的矩阵乘法和sigmoid映射运算

这种运算方式，非常适合编程，比如可以用Python的numpy很简单的实现。

最后需要一提的是，现在神经网络基本不再使用sigmoid了，比较流行的是ReLU（线性整流函数）。

100天搞定机器学习|Day35 深度学习之神经网络的结构的更多相关文章

100天搞定机器学习|day37 无公式理解反向传播算法之精髓
100天搞定机器学习(Day1-34) 100天搞定机器学习|Day35 深度学习之神经网络的结构 100天搞定机器学习|Day36 深度学习之梯度下降算法本篇为100天搞定机器学习之第37天,亦 ...
100天搞定机器学习|Day22 机器为什么能学习？
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...
100天搞定机器学习|Day17-18 神奇的逻辑回归
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...
100天搞定机器学习|Day7 K-NN
最近事情无比之多,换了工作.组队参加了一个比赛.和朋友搞了一些小项目,公号荒废许久.坚持是多么重要,又是多么艰难,目前事情都告一段落,我们继续100天搞定机器学习系列.想要继续做这个是因为,一方面在具 ...
100天搞定机器学习|Day11 实现KNN
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|D ...
100天搞定机器学习|Day8 逻辑回归的数学原理
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|D ...
100天搞定机器学习|Day9-12 支持向量机
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|D ...
100天搞定机器学习|Day19-20 加州理工学院公开课：机器学习与数据挖掘
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...
100天搞定机器学习|Day21 Beautiful Soup
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...

随机推荐

哈工大计算机网络Week2-网络应用数据交换
目录网络应用数据交换 P2P应用:原理与文件分发纯P2P架构文件分发:客户机/服务器 vs. P2P CS 为什么是这样的?不应该传送和发出难道是并行的??? P2P P2P文件分发典型例子:B ...
RestTemplate真实案例
1. 场景描述现在越来越的系统之间的交互采用http+json的交互方式,以前用的比较多的HttpClient,后来用的RestTemplate,感觉RestTemplate要比httpClent简 ...
Python 爬虫：煎蛋网妹子图
使用 Headless Chrome 替代了 PhatomJS. 图片保存到指定文件夹中. import requests from bs4 import BeautifulSoup from sel ...
windbg 配置符号路径
(转)WINDBG的符号下载与符号路径问题安装与配置 windbg 的 symbol (符号) 本篇是新手自己写的一点心得.建议新手看看.同时希望前辈多多指教. 写这篇的动机:在网上找了一上午的 w ...
踩坑 Spring Cloud Hystrix 线程池队列配置
背景: 有一次在生产环境,突然出现了很多笔还款单被挂起,后来排查原因,发现是内部系统调用时出现了Hystrix调用异常.在开发过程中,因为核心线程数设置的比较大,没有出现这种异常.放到了测试环境,偶尔 ...
[leetcode] 929. Unique Email Addresses (easy)
统计有几种邮箱地址. 邮箱名类型:local@domain 规则:1. local中出现"."的,忽略. a.bc=abc 2. local中出现"+"的,+以 ...
[leetcode] 110. Balanced Binary Tree (easy)
原题链接水题深度搜索每一节点的左右深度,左右深度差大于1就返回false. class Solution { public: bool isBalanced(TreeNode *root) { b ...
[系列] Gin框架 - 数据绑定和验证
目录概述推荐阅读概述上篇文章分享了 Gin 框架使用 Logrus 进行日志记录,这篇文章分享 Gin 框架的数据绑定与验证. 有读者咨询我一个问题,如何让框架的运行日志不输出控制台? 解决方 ...
RabbitMQ 实践之在处理异步任务中的流程
一.背景: 我司的系统,用户可以创建任务,启动任务,但任务的运行需要很长的时间,所以采用消息队列的方式,后台异步处理. 这里所用到的是 RabbitMQ . 二.MQ 处理任务的流程 ① ② ③ ④ ...
git commit规范化实践
最近从svn转到git进行代码版本控制,今天了解了git commit规范化的一些知识后,写此文章记录下配置过程. 环境编辑器使用的是vscode,项目框架是vue3.0 规范化工具规范化git ...

100天搞定机器学习|Day35 深度学习之神经网络的结构

100天搞定机器学习|Day35 深度学习之神经网络的结构的更多相关文章

随机推荐

热门专题