AI-4多层感知机

浪矢\n 2024-07-19 22:22:38 原文

4.1笔记

在线性网络中，任何特征的增大都会导致模型输出的增大或减小。这种想法在某些情况下不在适用，例如x和y并非线性关系、或者是x和y并不具有单调性、以及x1、x2会对y产生交互作用时。

为解决该问题，有人提出在网络中加入隐藏层，来克服线性模型的限制，使其能够处理更多变的函数关系。为防止多个隐藏层退化为单一的线性映射，在每个隐藏单元加入激活函数（非线性的），让模型更具表达力。

（即使是网络只有一个隐藏层，给定足够的神经元和正确的权重，我们可以对任意函数建模...... from d2l , why？）实际上，通常使用更深的（而不是更广的）网络。

几个常用的激活函数：ReLU函数，sigmoid函数，tanh函数

4.1练习

1算pReLU激活函数的导数。

当x>0时,

2证明一个仅使用ReLU（或pReLU）的多层感知机构造了一个连续的分段线性函数。

任意形式的ReLU可视为原始ReLU的放缩与平移

当x>=0时,ReLU(x)=x, 当x<0时，ReLU(x)=0,则仅需证明其在x=0出的连续性。

ReLU(0⁺)=0,ReLU(0^-)=0,故lim x->0,ReLU(x)=0.极限值存在且等于函数值.

因此，函数ReLU连续.

3证明tanh(x)+1=2sigmoid(2x)。

4假设我们有一个非线性单元，将它一次应用于一个小批量的数据。这会导致什么样的问题？

数据可能会被剧烈的拉伸或者压缩，可能会导致分布的偏移,若数据都小于0，则激活函数ReLU无法激活；若数据较大，则在激活函数sigmoid或者tanh中，结果区分度较低。与后面的神经元对接后可能会损失一定的特征。

AI-4多层感知机的更多相关文章

DeepLearning学习（1）--多层感知机
想直接学习卷积神经网络,结果发现因为神经网络的基础较弱,学习起来比较困难,所以准备一步步学.并记录下来,其中会有很多摘抄. (一)什么是多层感知器和反向传播 1,单个神经元神经网络的基本单元就是神经 ...
Alink漫谈(十四) ：多层感知机之总体架构
Alink漫谈(十四) :多层感知机之总体架构目录 Alink漫谈(十四) :多层感知机之总体架构 0x00 摘要 0x01 背景概念 1.1 前馈神经网络 1.2 反向传播 1.3 代价函 ...
Alink漫谈(十五) ：多层感知机之迭代优化
Alink漫谈(十五) :多层感知机之迭代优化目录 Alink漫谈(十五) :多层感知机之迭代优化 0x00 摘要 0x01 前文回顾 1.1 基本概念 1.2 误差反向传播算法 1.3 总 ...
Tensorflow 2.0 深度学习实战 —— 详细介绍损失函数、优化器、激活函数、多层感知机的实现原理
前言 AI 人工智能包含了机器学习与深度学习,在前几篇文章曾经介绍过机器学习的基础知识,包括了监督学习和无监督学习,有兴趣的朋友可以阅读< Python 机器学习实战 >.而深度学习开始只 ...
Theano3.4-练习之多层感知机
来自http://deeplearning.net/tutorial/mlp.html#mlp Multilayer Perceptron note:这部分假设读者已经通读之前的一个练习 Classi ...
学习笔记TF026:多层感知机
隐含层,指除输入.输出层外,的中间层.输入.输出层对外可见.隐含层对外不可见.理论上,只要隐含层节点足够多,只有一个隐含层,神经网络可以拟合任意函数.隐含层越多,越容易拟合复杂函数.拟合复杂函数,所需 ...
『TensorFlow』读书笔记_多层感知机
多层感知机输入->线性变换->Relu激活->线性变换->Softmax分类多层感知机将mnist的结果提升到了98%左右的水平知识点过拟合:采用dropout解决,本 ...
MXNET：多层感知机
从零开始前面了解了多层感知机的原理,我们来实现一个多层感知机. # -*- coding: utf-8 -*- from mxnet import init from mxnet import nd ...
基于theano的多层感知机的实现
1.引言一个多层感知机(Multi-Layer Perceptron,MLP)可以看做是,在逻辑回归分类器的中间加了非线性转换的隐层,这种转换把数据映射到一个线性可分的空间.一个单隐层的MLP就可以 ...
（数据科学学习手札44）在Keras中训练多层感知机
一.简介 Keras是有着自主的一套前端控制语法,后端基于tensorflow和theano的深度学习框架,因为其搭建神经网络简单快捷明了的语法风格,可以帮助使用者更快捷的搭建自己的神经网络,堪称深度 ...

随机推荐

python之pdf转换操作 PyMuPDF库学习
1. 资料链接github地址: pymupdf/PyMuPDF: Python bindings for MuPDF's rendering library官方手册: PyMuPDF Documen ...
HOOPS Exchange助力Shapr3D产品实现了“无障碍的用户体验”
HOOPS SDK是用于3D工业软件开发的工具包,其中包括4款工具,分别是用于读取和写入30多种CAD文件格式的HOOPS Exchange.专注于Web端工程图形渲染的HOOPS Communic ...
MySQL（一）Linux下MySQL的安装
Linux下MySQL的安装 1 MySQL的安装 1.1 Linux系统以及工具的准备这里使用两台CentOS7虚拟机,一台安装8.0版本,另一台克隆的虚拟机安装5.7版本克隆的虚拟机需要进行配 ...
PyTorch基础(Numpy & Tensor)
Numpy与Tensor是PyTorch的重要内容 Numpy的使用 Numpy是Python中科学计算的一个基础包,提供了一个多维度的数组对象,数组是由numpy.ndarray类来实现的,是Num ...
2023成都.NET线下技术沙龙圆满结束
2023年4月15日周六,由MASA技术团队和成都.NET俱乐部共同主办的2023年成都.NET线下技术沙龙活动在成都市世纪城新会展中心知域空间举行,共计报名人数90多人,实际到场60多人,13:30 ...
使用 Transformers 进行图分类
在之前的博文中,我们探讨了图机器学习的一些理论知识.这一篇我们将探索如何使用 Transformers 库进行图分类.(你也可以从此处下载演示 notebook,跟着一起做!) 目前,Tran ...
Swift下Data处理全流程：从网络下载，数模转换，本地缓存到页面使用
Swift下将网络返回json数据转换成struct 假如网络请求返回的数据结构是一个深层嵌套的Json 首先要通过key-value取出这个json中的数据源 // 将返回的json字符串转Dict ...
2022-06-17：给定一个数组arr，含有n个数字，可能有正、有负、有0，给定一个正数k。返回所有子序列中，累加和最大的前k个子序列累加和。假设K不大，怎么算最快？来自Amazon。
2022-06-17:给定一个数组arr,含有n个数字,可能有正.有负.有0, 给定一个正数k. 返回所有子序列中,累加和最大的前k个子序列累加和. 假设K不大,怎么算最快? 来自Amazon. 答案 ...
PictureBox保存图片照片到数据库
Private Sub PAPHOTO_SAVE() Try If TxtPictureURL.Text.ToString <> "" Then Dim SQL_Str ...
中文环境下使用 huggingface 模型替换 OpenAI的Embedding 接口
OpenAI的文本嵌入衡量文本字符串的相关性.嵌入通常用于: 搜索(其中结果按与查询字符串的相关性排名) 聚类(其中文本字符串按相似性分组) 推荐(推荐具有相关文本字符串的项目) 异常检测(识别出相关 ...