tensorflow笔记（北大网课实战）

1、

tf.multiply(x,y1)      # 对应元素相乘

 tf.matmul(x,y2)        # 矩阵相乘

2、会话：执行计算图中的节点运算的。

with tf.Session() as sess:

print sess.run(y)

3、参数：就是权重w，用变量表示。随机给初值。

w=tf.Variable(tf.random_normal([2,3],stddev=2,mean=0,seed=1))

正态分布，标准差为2 均值是0

tf.truncated_normal() 去掉过大偏离点的正态分布

4、前向传播：搭建模型，实现推理

输入层，隐藏层，输出层

5、变量初始化、计算图节点运算，都要用会话实现：

变量初始化：

init_op=tf.global_variables_initializer()

sess.run(init_op)

计算图节点运算：在sess.run函数中用feed_dict喂数据

6、用tf.placeholder占位，在sess.run函数中用feed_dict喂数据

喂一组数据：

x=tf.placeholder(tf.float32,shape=(1,2)) 多组数据的话，把1改成None

sess.run(y,feed_dict={x:[[0.5,0.6]]})

import tensorflow as tf

x = tf.placeholder(tf.float32,shape=(None,2))

w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))

w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))

a = tf.matmul(x, w1)

y = tf.matmul(a, w2)

with tf.Session() as sess:

    init_op = tf.global_variables_initializer()

    sess.run(init_op)

    print(sess.run(y,feed_dict={x: [[0.7, 0.5],[0.2,0.3],

                                    [0.3,0.4],[0.4,0.5]]}))

    print(sess.run(w1))

    print(sess.run(w2))

7、反向传播：训练模型参数，在所有参数上用梯度下降，使NN模型在训练数据对上的

损失函数最小。

损失函数(loss)：预测值y与已知答案y_的差距

均方误差MSE

loss=tf.reduce_mean(tf.square(y_-y))

反向传播训练方法：以减小loss值为优化目标

学习率：决定参数每次更新的幅度

import tensorflow as tf

import numpy as np

BATCH_SIZE = 8  #一次喂入的数据

seed = 23455

rng = np.random.RandomState(seed)

X=rng.rand(32,2)

Y=[[int(x0 + x1 < 1)] for (x0,x1) in X]

print(X)

print(Y)

x = tf.placeholder(tf.float32, shape=(None,2))#体积和重量两个特征

yy= tf.placeholder(tf.float32,shape=(None,1))#只有一个特征，合格或者不合格

w1=tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))

w2=tf.Variable(tf.random_normal([3,1],stddev=1,seed=1))

a=tf.matmul(x,w1)

y=tf.matmul(a,w2)

#定义损失函数及反向传播方法

loss = tf.reduce_mean(tf.square(yy-y))

train_step=tf.train.GradientDescentOptimizer(0.001).minimize(loss)#学习率为0.001

with tf.Session() as sess:

    init_op=tf.global_variables_initializer()

    sess.run(init_op)

    print(sess.run(w1))

    print(sess.run(w2))

    #训练模型

    STEPS=3000#训练三千轮

    for i in range(STEPS):

        start = (i*BATCH_SIZE)%32

        end = start+BATCH_SIZE

        sess.run(train_step, feed_dict={x: X[start:end],yy: Y[start: end]})

        if i % 500 == 0:  #每500轮打印一次loss值

           total_loss = sess.run(loss,feed_dict={x: X, yy: Y})

           print(i,total_loss)

        print(sess.run(w1))

        print(sess.run(w2))

8、搭建神经网络的八股：准备、前传、反传、迭代

（1）准备：import ；常量定义；生成数据集

（2）前向传播：定义输入、参数和输出

（3）反向传播：定义损失函数，反向传播方法

loss = train_step =

（4）生成会话，训练STEPS轮

9、损失函数

NN复杂度：多用NN层数和NN参数的个数表示

层数=隐藏层的层数+1个输出层

总参数=总w+总b

自定义损失函数：

交叉熵：表征两个概率分布之间的距离

10、学习率：每次参数更新的幅度

学习率设置多少合适？指数衰减率

11、滑动平均（影子值）

记录了每个参数一段时间内过往值得平均，增加了模型的泛化性。

针对所有参数：w、b

tensorflow笔记（北大网课实战）的更多相关文章

tensorflow笔记2（北大网课实战）
1.正则化缓解过拟合正则化在损失函数中引入模型复杂度指标,利用给w加权值,弱化了训练数据的噪声一般不会正则化b. 2.matplotlib.pyplot 3.搭建模块化的神经网络八股: 前向传播就 ...
对于coursera上三门北大网课的评测
今年暑假开始就选了coursera上三门北大的网课——C++程序设计.算法基础.数据结构基础,它们属于一个项目的,上的话每个月249块钱,项目里包括这三门一共有七门课.因为一开始是三门课同时上的,数据 ...
CoolBlog开发笔记第2课:搭建开发环境
教程目录 1.1 CoolBlog开发笔记第1课:项目分析前言今天是CoolBlog开发笔记的第2课,我们将要讲解的是开发环境的搭建.俗话说"工欲善其事必先利其器",Djang ...
CoolBlog开发笔记第3课:创建Django应用
教程目录 1.1 CoolBlog开发笔记第1课:项目分析 1.2 CoolBlog开发笔记第2课:搭建开发环境前言经过上一节我们已经创建了CoolBlog工程,但是关于CoolBlog的功能代码 ...
CoolBlog开发笔记第4课:数据库模型设计
教程目录 1.1 CoolBlog开发笔记第1课:项目分析 1.2 CoolBlog开发笔记第2课:搭建开发环境 1.3 CoolBlog开发笔记第3课:创建Django应用前言我新书<Py ...
CoolBlog开发笔记第5课:请求与响应
教程目录 1.1 CoolBlog开发笔记第1课:项目分析 1.2 CoolBlog开发笔记第2课:搭建开发环境 1.3 CoolBlog开发笔记第3课:创建Django应用 1.4 CoolBlog ...
手把手教你写电商爬虫-第三课实战尚妆网AJAX请求处理和内容提取
版权声明:本文为博主原创文章,未经博主允许不得转载. 系列教程: 手把手教你写电商爬虫-第一课找个软柿子捏捏手把手教你写电商爬虫-第二课实战尚妆网分页商品采集爬虫看完两篇,相信大家已经从开始的 ...
tensorflow笔记（一）之基础知识
tensorflow笔记(一)之基础知识版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7399701.html 前言这篇no ...
tensorflow笔记（二）之构造一个简单的神经网络
tensorflow笔记(二)之构造一个简单的神经网络版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7425200.html ...

随机推荐

NO8 find结合sed查找替换企业案例多方法精讲&命令总结！
·sed #替换 eg: sed 'sed 's#已有的内容#更改的内容#g' oldboy.txt s 代表替换,g代表全局,sg就是全局替换 ...
Java多线程之以7种方式让主线程等待子线程结束
记一次主线程等待子线程结束的多种方法的学习在学习多线程时,最开始遇到的问题其实是"计算子线程运行时间",写到最后发现本文和标题更为符合,但是仍然基于问题:"在主线程中获 ...
C语言备忘录——static
对于这个关键字我一直没有弄清楚,今天特地去花了一定的时间去理解这个关键字.在函数或变量声明时,在数据类型前加上 static 后会有以下几个效果一.用于函数定义时: 1.函数的链接属性会被修改,从e ...
netty权威指南学习笔记五——分隔符和定长解码器的应用
TCP以流的方式进行数据传输,上层应用协议为了对消息进行区分,通常采用以下4中方式: 消息长度固定,累计读取到长度综合为定长LEN的报文后,就认为读取到了一个完整的消息,将计数器置位,重新开始读取下一 ...
Python 实现类似range函数
需求:写一个属于你自己的 frange函数,frange与range类似,一样的参数规则,但是每一项必须要是float类型实现: 注意点,如何判断stop是否有参数传入,这里使用空字符判断,如fra ...
Gauss列主消元
问题:1.列主消元为什么精度高? 2.fabs函数精确度 #include<iostream> #include<cstdio> #include<cstring> ...
二、JavaScript之点击按钮改变HTML样式 (CSS)
一.代码如下二.点击前三.点击后 <!DOCTYPE html> <html> <meta http-equiv="Content-Type" c ...
第二阶段scrum-4
1.整个团队的任务量: 2.任务看板: 会议照片: 产品状态: 前端制作完成,数据库在制作中.
check Linux文件夹个数
(ls -l|grep "^-"| wc -l)查看某个文件夹下文件的个数.(ls -lR|grep "^-"| wc -l)查看某个文件夹下文件的个数,包括子 ...
hadoop的文件操作整理java
package dada; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; im ...

tensorflow笔记（北大网课实战）

tensorflow笔记（北大网课实战）的更多相关文章

随机推荐

热门专题