Tensorflow 梯度下降实例

# coding: utf-8

# #### 假设我们要最小化函数  $y=x^2$, 选择初始点   $x_0=5$

# #### 1. 学习率为1的时候，x在5和-5之间震荡。

# In[1]:

import tensorflow as tf

TRAINING_STEPS = 10

LEARNING_RATE = 1

x = tf.Variable(tf.constant(5, dtype=tf.float32), name="x")

y = tf.square(x)

train_op = tf.train.GradientDescentOptimizer(LEARNING_RATE).minimize(y)

with tf.Session() as sess:

    sess.run(tf.global_variables_initializer())

    for i in range(TRAINING_STEPS):

        sess.run(train_op)

        x_value = sess.run(x)

        print "After %s iteration(s): x%s is %f."% (i+1, i+1, x_value)

#result 学习率为1的时候，x在5和-5之间震荡。

# After 1 iteration(s): x1 is -5.000000.

# After 2 iteration(s): x2 is 5.000000.

# After 3 iteration(s): x3 is -5.000000.

# After 4 iteration(s): x4 is 5.000000.

# After 5 iteration(s): x5 is -5.000000.

# After 6 iteration(s): x6 is 5.000000.

# After 7 iteration(s): x7 is -5.000000.

# After 8 iteration(s): x8 is 5.000000.

# After 9 iteration(s): x9 is -5.000000.

# After 10 iteration(s): x10 is 5.000000.

# #### 2. 学习率为0.001的时候，下降速度过慢，在901轮时才收敛到0.823355。

# In[2]:

TRAINING_STEPS = 1000

LEARNING_RATE = 0.001

x = tf.Variable(tf.constant(5, dtype=tf.float32), name="x")

y = tf.square(x)

train_op = tf.train.GradientDescentOptimizer(LEARNING_RATE).minimize(y)

with tf.Session() as sess:

    sess.run(tf.global_variables_initializer())

    for i in range(TRAINING_STEPS):

        sess.run(train_op)

        if i % 100 == 0:

            x_value = sess.run(x)

            print "After %s iteration(s): x%s is %f."% (i+1, i+1, x_value)

# After 1 iteration(s): x1 is 4.990000.

# After 101 iteration(s): x101 is 4.084646.

# After 201 iteration(s): x201 is 3.343555.

# After 301 iteration(s): x301 is 2.736923.

# After 401 iteration(s): x401 is 2.240355.

# After 501 iteration(s): x501 is 1.833880.

# After 601 iteration(s): x601 is 1.501153.

# After 701 iteration(s): x701 is 1.228794.

# After 801 iteration(s): x801 is 1.005850.

# After 901 iteration(s): x901 is 0.823355.

# #### 3. 使用指数衰减的学习率，在迭代初期得到较高的下降速度，可以在较小的训练轮数下取得不错的收敛程度。

# In[3]:

TRAINING_STEPS = 100

global_step = tf.Variable(0)

LEARNING_RATE = tf.train.exponential_decay(0.1, global_step, 1, 0.96, staircase=True)

x = tf.Variable(tf.constant(5, dtype=tf.float32), name="x")

y = tf.square(x)

train_op = tf.train.GradientDescentOptimizer(LEARNING_RATE).minimize(y, global_step=global_step)

with tf.Session() as sess:

    sess.run(tf.global_variables_initializer())

    for i in range(TRAINING_STEPS):

        sess.run(train_op)

        if i % 10 == 0:

            LEARNING_RATE_value = sess.run(LEARNING_RATE)

            x_value = sess.run(x)

            print "After %s iteration(s): x%s is %f, learning rate is %f."% (i+1, i+1, x_value, LEARNING_RATE_value)

# After 1 iteration(s): x1 is 4.000000, learning rate is 0.096000.

# After 11 iteration(s): x11 is 0.690561, learning rate is 0.063824.

# After 21 iteration(s): x21 is 0.222583, learning rate is 0.042432.

# After 31 iteration(s): x31 is 0.106405, learning rate is 0.028210.

# After 41 iteration(s): x41 is 0.065548, learning rate is 0.018755.

# After 51 iteration(s): x51 is 0.047625, learning rate is 0.012469.

# After 61 iteration(s): x61 is 0.038558, learning rate is 0.008290.

# After 71 iteration(s): x71 is 0.033523, learning rate is 0.005511.

# After 81 iteration(s): x81 is 0.030553, learning rate is 0.003664.

# After 91 iteration(s): x91 is 0.028727, learning rate is 0.002436.

Tensorflow 梯度下降实例的更多相关文章

Tensorflow梯度下降应用
import tensorflow as tfimport numpy as np #使用numpy生成随机点x_data = np.random.rand(100)y_data = x_data*0 ...
tensorflow梯度下降
import numpy as np import tensorflow as tf import matplotlib.pyplot as plt num_points = 1000 vectors ...
TensorFlow实现梯度下降
# -*- coding: utf-8 -*- """ Created on Mon Oct 15 17:38:39 2018 @author: zhen "& ...
Python之TensorFlow的变量收集、自定义命令参数、矩阵运算、梯度下降-4
一.TensorFlow为什么要存在变量收集的过程,主要目的就是把训练过程中的数据,比如loss.权重.偏置等数据通过图形展示的方式呈现在开发者的眼前. 自定义参数:自定义参数,主要是通过Python ...
Tensorflow细节-P84-梯度下降与批量梯度下降
1.批量梯度下降批量梯度下降法是最原始的形式,它是指在每一次迭代时使用所有样本来进行梯度的更新.从数学上理解如下: 对应的目标函数(代价函数)即为: (1)对目标函数求偏导: (2)每次迭代对参数进 ...
线性回归、梯度下降（Linear Regression、Gradient Descent）
转载请注明出自BYRans博客:http://www.cnblogs.com/BYRans/ 实例首先举个例子,假设我们有一个二手房交易记录的数据集,已知房屋面积.卧室数量和房屋的交易价格,如下表: ...
Andrew Ng机器学习课程笔记--week10(优化梯度下降)
本周主要介绍了梯度下降算法运用到大数据时的优化方法. 一.内容概要 Gradient Descent with Large Datasets Stochastic Gradient Descent M ...
采用梯度下降优化器(Gradient Descent optimizer)结合禁忌搜索(Tabu Search)求解矩阵的全部特征值和特征向量
[前言] 对于矩阵(Matrix)的特征值(Eigens)求解,采用数值分析(Number Analysis)的方法有一些,我熟知的是针对实对称矩阵(Real Symmetric Matrix)的特征 ...
梯度下降与pytorch
记得在tensorflow的入门里,介绍梯度下降算法的有效性时使用的例子求一个二次曲线的最小值. 这里使用pytorch复现如下: 1.手动计算导数,按照梯度下降计算 import torch #使用 ...

随机推荐

Could not parse the file: d:\matlab7\toolbox\ccslink\ccslink\info.xml
找到安装目录下的info.xml文件,用记事本打开. 我的安装目录是:D:\MATLAB7\toolbox\ccslink\ccslink 用记事本打开,显示如下内容: <productinfo ...
spring作用域（Spring Bean Scopes Example）
http://docs.spring.io/spring/docs/2.0.x/reference/beans.html#beans-factory-scopes In Spring, bean sc ...
hadoop 异常及处理总结-02(小马哥精品)
一直以来,对hdfs的警告信息不报以理睬,今天突然关注了一下.每当我操作hdfs的时候就会出现这样一个警告: WARN util.NativeCodeLoader: Unable to load na ...
std::nothrow
std::nothrow 1.在内存不足时,new (std::nothrow)并不抛出异常,而是将指针置NULL. 若不使用std::nothrow,则分配失败时程序直接抛出异常. 2.使用方式: ...
JDBC 利用反射技术将查询结果封装为对象(简单ORM实现）
ORM(Object Relational Mapping)对象关系映射 public class ORMTest { public static void main(String[] args) t ...
移动通信安全——GSM安全体系
一.GSM网络概述 1.安全机制认证用户,防止未授权接入对空中接口传输加密,防止无线信道上用户信息被窃听 SIM卡独立于终端,管理用户信息在空中接口上以临时身份标识用户,防止用户被跟踪但是GS ...
spring.xml从外部文件引入数据库配置信息
 <context:property-placeholder location="classpath:jdbc.properties" ...
在 Ubuntu12.04/Xubuntu12.04 上安装 QQ2012，这才是真正可行的
2012-5-18 11:16:29 1. 安装wine 终端下输入: sudo apt-get install wine 复制代码有人这样:sudo apt-get install wine ...
XML相关转换
1.将DataTable转换成xml字符串 //将DataTable转换成xml字符串: public string ConvertDataTableToXml(DataTable dt) { Mem ...
C#:xml操作（待补充）
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.X ...

Tensorflow 梯度下降实例

Tensorflow 梯度下降实例的更多相关文章

随机推荐

热门专题