【深度学习笔记】第 2 课：Logistic 多项式回归法

 """Softmax."""

 scores = [3.0, 1.0, 0.2]

 import numpy as np

 def softmax(x):

     """Compute softmax values for x."""

     #pass # TODO:Compute and return softmax(x)

     return np.exp(x) / np.sum(np.exp(x), axis=0)

 #print(softmax(scores))

 print (softmax(scores*10))

 #print (softmax(scores / 10))

softmax模型可以用来给不同的对象分配概率。即使在之后，我们训练更加精细的模型时，最后一步也需要用softmax来分配概率。

cross-entropy 交叉熵是度量这两个向量距离的方法之一。我们将记它为D以表示距离。 labels标签向量经过了one-hot编码，所以会有很多的零，因而它不能作为对数的真数。

对于分布变量，它是由softmax方法计算得到的概率值。所以它总是会大于0, 也就是它可以被放在真数上。

对于一个给定的输入通过一个线性模型，它将被转变为一个logit分数。这个运算很简单，即输入乘上一个矩阵w再加上一个偏置项b

接着使用softmax方法，我们可以将logits分数转化成概率值，接着我们通过交叉熵的方法计算概率向量与经过one-hot编码的标签向量的距离

我们称这整个过程为Logistic 多项式回归法

好了，现在我们对问题的各个方面有了一个大致的了解，这门课的任务是教我们该如何确定权重项w和偏置项b的值

以使我们的分类器能够完成我们所期望的工作。

也就是说要使之对正确分类距离要足够小对错误分类的距离足够大

可以选择通过这样的方式衡量，求出对所有训练集样本和所有类别的距离之和，也就是求出训练罚函数（That's called the training loss.）

这个函数求出了对于所有训练集样本的交叉熵的均值，是一个非常庞大的函数。

训练集中的每个样本都将被乘上这个巨大的W矩阵，并且他们都将被加起来，得到这个巨大的求和。

我们希望每一个距离值都很小，也就是说分类器能够对训练集中的每个样本都能很好的分类，因而我们希望这个罚函数值很小。

罚函数是一个关于权重项w和偏差项b的函数，那么我们如何求罚函数的最小值

作为演示考察某罚函数只有两个自变量，我们记为w1和w2。该函数的值在某些区域很大，在另一些区域很小。

我们的目标是去寻找使得罚函数值最小的权重值w，因而我们将一个机器学习问题转化为了一个数值优化问题

而我们有许多的方法来解决这个数值优化的问题

最简单的方法之一也许你可能遇到过是梯度下降法（gradient descent）

对罚函数的每一个变量求偏导数，并将每个变量值加上该偏导数值，直到你达到全局最小值

梯度下降法相对而言比较简单，特别是你能够帮你高效求出偏导数的数值工具的时候，这个只是演示了一个二元函数的偏导数求算过程，但对于一个一般的问题

我们可能面对的是一个有成百上千参数的函数。

在接下来的课程中我们将会讨论为你计算导数的工具，和梯度下降的一些优点和缺点，目前，我们将会假设我给你的优化程序是一个黑盒子，你可以简单的使用

最后有两个实用的东西阻挡在你训练模型的路上，第一个是你怎么把图像像素填充到分类器，第二个是在哪里初始化最优化过程

【深度学习笔记】第 2 课：Logistic 多项式回归法的更多相关文章

Google TensorFlow深度学习笔记
Google Deep Learning Notes Google 深度学习笔记由于谷歌机器学习教程更新太慢,所以一边学习Deep Learning教程,经常总结是个好习惯,笔记目录奉上. Gith ...
深度学习笔记：优化方法总结(BGD,SGD,Momentum,AdaGrad,RMSProp,Adam)
深度学习笔记:优化方法总结(BGD,SGD,Momentum,AdaGrad,RMSProp,Adam) 深度学习笔记(一):logistic分类深度学习笔记(二):简单神经网络,后向传播算法及实现 ...
UFLDL深度学习笔记（二）SoftMax 回归(矩阵化推导)
UFLDL深度学习笔记 (二)Softmax 回归本文为学习"UFLDL Softmax回归"的笔记与代码实现,文中略过了对代价函数求偏导的过程,本篇笔记主要补充求偏导步骤的详细 ...
UFLDL深度学习笔记（一）反向传播与稀疏自编码
UFLDL深度学习笔记 (一)基本知识与稀疏自编码前言近来正在系统研究一下深度学习,作为新入门者,为了更好地理解.交流,准备把学习过程总结记录下来.最开始的规划是先学习理论推导:然后学习一两种开源 ...
UFLDL深度学习笔记（七）拓扑稀疏编码与矩阵化
UFLDL深度学习笔记 (七)拓扑稀疏编码与矩阵化主要思路前面几篇所讲的都是围绕神经网络展开的,一个标志就是激活函数非线性:在前人的研究中,也存在线性激活函数的稀疏编码,该方法试图直接学习数据的特 ...
UFLDL深度学习笔记（六）卷积神经网络
UFLDL深度学习笔记 (六)卷积神经网络 1. 主要思路 "UFLDL 卷积神经网络"主要讲解了对大尺寸图像应用前面所讨论神经网络学习的方法,其中的变化有两条,第一,对大尺寸图像 ...
UFLDL深度学习笔记（五）自编码线性解码器
UFLDL深度学习笔记 (五)自编码线性解码器 1. 基本问题在第一篇 UFLDL深度学习笔记 (一)基本知识与稀疏自编码中讨论了激活函数为$sigmoid$函数的系数自编码网络,本文要讨论&q ...
UFLDL深度学习笔记（四）用于分类的深度网络
UFLDL深度学习笔记 (四)用于分类的深度网络 1. 主要思路本文要讨论的"UFLDL 建立分类用深度网络"基本原理基于前2节的softmax回归和无监督特征学习,区别在于使 ...
UFLDL深度学习笔记（三）无监督特征学习
UFLDL深度学习笔记 (三)无监督特征学习 1. 主题思路 "UFLDL 无监督特征学习"本节全称为自我学习与无监督特征学习,和前一节softmax回归很类似,所以本篇笔记会比较 ...

随机推荐

pidstat 命令（Linux 进程使用资源情况采样）
pidstat 作用 pidstat 获取服务器指定进程的使用资源信息(包括 CPU.设备IO.内存.线程.任务切换等). 执行一波 [root@wille ~]# pidstat Linux 2.6 ...
shell脚本日志指南（1）
1.初始化日志文件.对文件的大小进行判断和压缩 LOG=$ if [ -e "${LOG}" ];then LOG_SIZE=`ls -l "${LOG}"| ...
tornado下pandas ndarray乱试
from tornado.web import RequestHandler from pymongo import MongoClient import pandas,xlrd from panda ...
手机端css实现active伪类
今天遇到手机端的css中a标签的active不起作用,原本想循环a标签,给当前的a标签添加class来解决,可觉得有点儿小麻烦,经查资料了解到解决此问题,只需要添加一个touchstart的空事件即可 ...
2019ICPC沈阳网络赛-D-Fish eating fruit(树上DP, 换根, 点分治)
链接: https://nanti.jisuanke.com/t/41403 题意: State Z is a underwater kingdom of the Atlantic Ocean. Th ...
29. ClustrixDB 分布式架构/并发控制
介绍 ClustrixDB使用多版本并发控制(MVCC)和2阶段锁(2PL)的组合来支持混合的读写工作负载.在我们的系统中,读取器享受无锁快照隔离,而写入器使用2PL来管理冲突.并发控制的组合意味着读 ...
js获取iframe里面的dom
最近在写页面遇到了问题,一个dom好多地方用到,然后我就单独写了个html页面,然后用iframe引入,但是,想获取iframe里面input的value,获取不到input,后面才知道原来js不能直 ...
BZOJ 2669 Luogu P3160 [CQOI2012]局部极小值 (容斥原理、DP)
题目链接 (bzoj) https://www.lydsy.com/JudgeOnline/problem.php?id=2669 (luogu) https://www.luogu.org/prob ...
Mysql cluster管理节点配置文件详解
一.定义MySQL Cluster的TCP/IP连接TCP/IP是MySQL集群用于建立连接的默认传输协议,正常情况下不需要定义连接.可使用“[TCP DEFAULT]”或“[TCP]”进行定义. 1 ...
C++入门经典-例3.8-使用条件表达式判断一个数是否是3和5的整倍数
1:代码如下: // 3.8.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include<iostream> using ...

【深度学习笔记】第 2 课：Logistic 多项式回归法

【深度学习笔记】第 2 课：Logistic 多项式回归法的更多相关文章

随机推荐

热门专题