Theano学习笔记（二）——逻辑回归函数解析

有了前面的准备，能够用Theano实现一个逻辑回归程序。逻辑回归是典型的有监督学习。

为了形象。这里我们如果分类任务是区分人与狗的照片。

首先是生成随机数对象

importnumpy

importtheano

importtheano.tensor as T

rng= numpy.random

数据初始化

有400张照片，这些照片不是人的就是狗的。

每张照片是28*28=784的维度。

D[0]是训练集。是个400*784的矩阵，每一行都是一张照片。

D[1]是每张照片相应的标签。用来记录这张照片是人还是狗。

training_steps是迭代上限。

N= 400

feats= 784

D= (rng.randn(N, feats), rng.randint(size=N, low=0, high=2))

training_steps= 10000

#Declare Theano symbolic variables

x= T.matrix("x")

y= T.vector("y")

w= theano.shared(rng.randn(feats), name="w")

b= theano.shared(0., name="b")

print"Initial model:"

printw.get_value(), b.get_value()

x是输入的训练集，是个矩阵，把D[0]赋值给它。

y是标签，是个列向量，400个样本所以有400维。把D[1]赋给它。

w是权重列向量。维数为图像的尺寸784维。

b是偏倚项向量，初始值都是0。这里没写成向量是由于之后要广播形式。

#Construct Theano expression graph

p_1= 1 / (1 + T.exp(-T.dot(x, w) - b))   #Probability that target = 1

prediction= p_1 > 0.5                    # Theprediction thresholded

xent= -y * T.log(p_1) - (1-y) * T.log(1-p_1) # Cross-entropy loss function

cost= xent.mean() + 0.01 * (w ** 2).sum()# The cost to minimize

gw,gb = T.grad(cost, [w, b])             #Compute the gradient of the cost

                                          # (we shall return to this in a

                                          #following section of this tutorial)

这里是函数的主干部分，涉及到3个公式

1.判定函数

{h_\theta }\left( x \right) = \frac{1}{{I + {e^{ - {\theta ^T}X}}}}" alt="">

2.代价函数

Cost\left( {{h_\theta }\left( x \right),y} \right) = \left\{ \begin{array}{r}\begin{array}{*{20}{c}}{ - \log \left( {{h_\theta }\left( x \right)} \right)}&{\begin{array}{*{20}{c}}{if}&{y = 1}\end{array}}\end{array}\\\begin{array}{*{20}{c}}{ - \log \left( {1 - {h_\theta }\left( x \right)} \right)}&{\begin{array}{*{20}{c}}{if}&{y = 0}\end{array}}\end{array}\end{array} \right." alt="">

3.总目标函数

$J\left( \theta \right) = - \frac{1}{m}\left[ {\sum\limits_{i = 1}^m {\left( {{y^{\left( i \right)}}\log {h_\theta }\left( {{x^{\left( i \right)}}} \right) + \left( {1 - {y^{\left( i \right)}}} \right)\log \left( {1 - {h_\theta }\left( {{x^{\left( i \right)}}} \right)} \right)} \right)} } \right] + \frac{\lambda }{2}\sum\limits_{i = 1}^m {W_i^2}$

第二项是权重衰减项，减小权重的幅度。用来防止过拟合的。

#Compile

train= theano.function(

          inputs=[x,y],

          outputs=[prediction, xent],

          updates=((w, w - 0.1 * gw), (b, b -0.1 * gb)))

predict= theano.function(inputs=[x], outputs=prediction)

构造预測和训练函数。

#Train

fori in range(training_steps):

    pred,err = train(D[0], D[1])

print"Final model:"

printw.get_value(), b.get_value()

print"target values for D:", D[1]

print"prediction on D:", predict(D[0])

这里算过之后发现，经过10000次训练，预測结果与标签已经全然同样了。

欢迎參与讨论并关注本博客和微博以及知乎个人主页兴许内容继续更新哦~

转载请您尊重作者的劳动，完整保留上述文字以及文章链接，谢谢您的支持。

Theano学习笔记（二）——逻辑回归函数解析的更多相关文章

[Firefly引擎][学习笔记二][已完结]卡牌游戏开发模型的设计
源地址:http://bbs.9miao.com/thread-44603-1-1.html 在此补充一下Socket的验证机制:socket登陆验证.会采用session会话超时的机制做心跳接口验证 ...
微信小程序学习笔记二数据绑定 + 事件绑定
微信小程序学习笔记二 1. 小程序特点概述没有DOM 组件化开发: 具备特定功能效果的代码集合体积小, 单个压缩包体积不能大于2M, 否则无法上线小程序的四个重要的文件 *js *.wxml - ...
MongoDB学习笔记二- Mongoose
MongoDB学习笔记二 Mongoose Mongoose 简介之前我们都是通过shell来完成对数据库的各种操作, 在开发中大部分时候我们都需要通过程序来完成对数据库的操作而Mongoose就 ...
java之jvm学习笔记二(类装载器的体系结构)
java的class只在需要的时候才内转载入内存,并由java虚拟机的执行引擎来执行,而执行引擎从总的来说主要的执行方式分为四种, 第一种,一次性解释代码,也就是当字节码转载到内存后,每次需要都会重新 ...
《SQL必知必会》学习笔记二)
<SQL必知必会>学习笔记(二) 咱们接着上一篇的内容继续.这一篇主要回顾子查询,联合查询,复制表这三类内容. 上一部分基本上都是简单的Select查询,即从单个数据库表中检索数据的单条语 ...
Django学习笔记二
Django学习笔记二模型类,字段,选项,查询,关联,聚合函数,管理器, 一字段属性和选项 1.1 模型类属性命名限制 1)不能是python的保留关键字. 2)不允许使用连续的下划线,这是由dj ...
ES6学习笔记<二>arrow functions 箭头函数、template string、destructuring
接着上一篇的说. arrow functions 箭头函数 => 更便捷的函数声明 document.getElementById("click_1").onclick = ...
muduo学习笔记(二)Reactor关键结构
目录 muduo学习笔记(二)Reactor关键结构 Reactor简述什么是Reactor Reactor模型的优缺点 poll简述 poll使用样例 muduo Reactor关键结构 Chan ...
python3.4学习笔记(二十六) Python 输出json到文件,让json.dumps输出中文实例代码
python3.4学习笔记(二十六) Python 输出json到文件,让json.dumps输出中文实例代码 python的json.dumps方法默认会输出成这种格式"\u535a\u ...
python3.4学习笔记(二十四) Python pycharm window安装redis MySQL-python相关方法
python3.4学习笔记(二十四) Python pycharm window安装redis MySQL-python相关方法window安装redis,下载Redis的压缩包https://git ...

随机推荐

PHPCMS V9.3.2用户注册模板中的一个低级Bug
当我们下载了目前最新的PHPCMS的时候,如果我们修改了用户注册的模板,那么模板缓存就会更新,这时候就会如下的问题: Parse error: syntax error, unexpected T_ ...
U3D学习笔记
1.向量的点乘.叉乘以及归一化的意义 1)点乘描述了两个向量的相似程度,结果越大两向量越相似,还可表示投影 2)叉乘得到的向量垂直于原来的两个向量 3)标准化向量:用在只关系方向,不关心大小的时候用 ...
整数运算：CPU内部只有加法运算
学汇编的一边儿去.我这里讲的是CPU进行计算的原理.首先我这里用MC的红石电路模拟了一个加法器:http://www.0xaa55.com/thread-313-1-1.htm首先加法器是怎么实现的呢 ...
ASP.NET MVC 5 学习教程：添加查询
原文 ASP.NET MVC 5 学习教程:添加查询起飞网 ASP.NET MVC 5 学习教程目录: 添加控制器添加视图修改视图和布局页控制器传递数据给视图添加模型创建连接字符串通过控 ...
java 访问 mysql 数据库的字符集设置
mysql是在linux下,java代码通过jdbc访问总是中文乱码.做过如下尝试: 1)修改 mysql的 my.cnf文件,设置 default-character-set等参数 2) 利用alt ...
SolrCloud Hello Word
Solr Cloud 设计出来的目的是使你的搜索服务具有更高的可用性,提高容错.容灾能力.下面我们在一台电脑上建立2个solr服务,作为一个solrCloud分片(shard),初步认识一下solrC ...
金融管理 - MBA智库百科
金融管理 - MBA智库百科金融管理出自 MBA智库百科(http://wiki.mbalib.com/) 金融管理(Financial Management) 目录 ...
将EC2里的实例导出到RAW文件并进行修改
你可能有自己的instance在amazon云环境里面,或者是你想深度修改一下marketplace里面提供的那些系统又估计运行中的instance改动不方便亚马逊作为云计算领域的大哥大,我不得不说 ...
理光C5502A 打印模糊问题
1.这款打印机好几W,我来的时候就有了.挺高端的. 2.来的时候由于网络没建成.建成之后,全部设置成网络打印机. 3.可以扫描成jpg\pdf,并且可以通过共享设置成扫描到目的地. 4.还有其它一些功 ...
stm32中断优先级
VIC_IRQChannelPreemptionPriority:先占优先级 NVIC_IRQChannelSubPriority:从优先级高先占优先级中断可以打断低先占优先级的中断,即可中断嵌套 ...

Theano学习笔记（二）——逻辑回归函数解析

Theano学习笔记（二）——逻辑回归函数解析的更多相关文章

随机推荐

热门专题