【机器学习】TensorFlow学习（一）

感谢中国人民大学胡鹤老师，课讲得非常好~

首先，何谓tensor？即高维向量，例如矩阵是二维，tensor是更广义意义上的n维向量（有type+shape）

TensorFlow执行过程为定义图，其中定义子节点，计算时只计算所需节点所依赖的节点，是一种高效且适应大规模的数据计算，方便分布式设计，对于复杂神经网络的计算，可将其拆开到其他核中同时计算。

Theano——torch———caffe（尤其是图像处理）——deeplearning5j——H20——MXNet，TensorFlow

运行环境

下载docker

打开docker quickstart terminal

标红地方显示该docker虚拟机IP地址（即之后的localhost）

docker tensorflow/tensorflow　　//自动找到TensorFlow容器并下载

docker images　　//浏览当前容器

docker run -p 8888:8888 tensorflow/tensorflow　　//在8888端口运行

会出现一个token，复制该链接并替换掉localhost，既可以打开TensorFlow的一个编写器，jupyter

大体雏形

#python导入

import tensorflow as tf

#定义变量（节点）

x = tf.Variable(3, name="x")

y = tf.Variable(4, name="y")

f = x*x*y + y + 2

#定义session

sess = tf.Session()

#为已经定义的节点赋值

sess.run(x.initializer)

sess.run(y.initializer)

#运行session

result = sess.run(f)

print(result)  #

#释放空间

sess.close

还有一个更简洁的一种定义并运行session方法

# a better way

with tf.Session() as sess:

    x.initializer.run()

    y.initializer.run()

    #即evaluate，求解f的值

    result = f.eval()

初始化的两行也可以写作

init = tf.global_variables_initializer()

init.run()

而session可以改作sess=tf.InteractiveSession()运行起来更方便

init = tf.global_variables_initializer()

sess = tf.InteractiveSession()

init.run()

result = f.eval()

print(result)

因而TensorFlow的代码分为两部分，定义部分和执行部分

TensorFlow是一个图的操作，有自动缺省的默认图和你自己定义的图

#系统默认缺省的图

>>> x1 = tf.Variable(1)

>>> x1.graph is tf.get_default_graph()

True

#自定义的图

>>> graph = tf.Graph()

>>> with graph.as_default():

x2 = tf.Variable(2)

>>> x2.graph is graph

True

>>> x2.graph is tf.get_default_graph()

False

节点的生命周期

第二种方法可以找出公共部分，避免x被计算2次。

运行结束后所有节点的值都被清空，如果没有单独保存，还需重新run一遍。

w = tf.constant(3)

x = w + 2

y = x + 5

z = x * 3

with tf.Session() as sess:

    print(y.eval()) #

    print(z.eval()) #

with tf.Session() as sess:

    y_val, z_val = sess.run([y, z])

    print(y_val) #

    print(z_val) #

Linear Regression with TensorFlow（线性回归上的应用）

y = wx+b = wx'　　//这里x'是相较于x多了一维全是1的向量

这里引用California housing的数据

TensorFlow上向量是列向量，需要reshape(-1,1)即转置成列向量

使用normal equation方法求解

import numpy as np

from sklearn.datasets import fetch_california_housing

housing = fetch_california_housing()

#获得数据维度，矩阵的行列长度

m, n = housing.data.shape

#np.c_是连接的含义，加了一个全为1的维度

housing_data_plus_bias = np.c_[np.ones((m, 1)), housing.data]

#数据量并不大，可以直接用常量节点装载进来，但是之后海量数据无法使用（会用minbatch的方式导入数据）

X = tf.constant(housing_data_plus_bias, dtype=tf.float32, name="X")

#转置成列向量

y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")

XT = tf.transpose(X)

#使用normal equation的方法求解theta，之前线性模型中有提及

theta = tf.matmul(tf.matmul(tf.matrix_inverse(tf.matmul(XT, X)), XT), y)

#求出权重

with tf.Session() as sess:

    theta_value = theta.eval()

如果是原本的方法，可能更直接些。但由于使用底层的库不同，它们计算出来的值不完全相同。

#使用numpy

X = housing_data_plus_bias

y = housing.target.reshape(-1, 1)

theta_numpy = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y)

#使用sklearn

from sklearn.linear_model import LinearRegression

lin_reg = LinearRegression()

lin_reg.fit(housing.data, housing.target.reshape(-1, 1))

这里不禁感到疑惑，为什么TensorFlow感觉变复杂了呢？其实，这不过因为这里数据规模较小，进行大规模的计算时，TensorFlow的自动优化所发挥的效果，是十分厉害的。

使用gradient descent（梯度下降）方法求解

#使用gradient时需要scale一下

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()

scaled_housing_data = scaler.fit_transform(housing.data)

scaled_housing_data_plus_bias = np.c_[np.ones((m, 1)), scaled_housing_data]

#迭代1000次

n_epochs = 1000

learning_rate = 0.01

#由于使用gradient，写入x的值需要scale一下

X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")

y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")

#使用gradient需要有一个初值

theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name="theta")

#当前预测的y，x是m*（n+1），theta是（n+1）*1，刚好是y的维度

y_pred = tf.matmul(X, theta, name="predictions")

#整体误差

error = y_pred - y

#TensorFlow求解均值功能强大，可以指定维数，也可以像下面方法求整体的

mse = tf.reduce_mean(tf.square(error), name="mse")

#暂时自己写出训练过程，实际可以采用TensorFlow自带的功能更强大的自动求解autodiff方法

gradients = 2/m * tf.matmul(tf.transpose(X), error)

training_op = tf.assign(theta, theta - learning_rate * gradients)

#初始化并开始求解

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    for epoch in range(n_epochs):

        #每运行100次打印一下当前平均误差

        if epoch % 100 == 0:

            print("Epoch", epoch, "MSE =", mse.eval())

        sess.run(training_op)

    best_theta = theta.eval()

上述代码中的autodiff如下，可以自动求出gradient

gradients = tf.gradients(mse, [theta])[0]

使用Optimizer

上述的整个梯度下降和迭代方法，都封装了在如下方法中

optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)

training_op = optimizer.minimize(mse)

这样的optimizer还有很多

例如带冲量的optimizer = tf.train.MomentumOptimizer(learning_rate=learning_rate,momentum=0.9)

Feeding data to training algorithm

当数据量达到几G，几十G时，使用constant直接导入数据显然是不现实的，因而我们用placeholder做一个占位符

（一般行都是none，即数据量是任意的）

真正运行，run的时候再feed数据。可以不断使用新的数据。

>>> A = tf.placeholder(tf.float32, shape=(None, 3))

>>> B = A + 5

>>> with tf.Session() as sess:

... B_val_1 = B.eval(feed_dict={A: [[1, 2, 3]]})

... B_val_2 = B.eval(feed_dict={A: [[4, 5, 6], [7, 8, 9]]})

...

>>> print(B_val_1)

[[ 6. 7. 8.]]

>>> print(B_val_2)

[[ 9. 10. 11.]

[ 12. 13. 14.]]

这样，就可以通过定义min_batch来分批次随机抽取指定数量的数据，即便是几T的数据也可以抽取。

batch_size = 100

n_batches = int(np.ceil(m / batch_size))

#有放回的随机抽取数据

def fetch_batch(epoch, batch_index, batch_size):

    #定义一个随机种子

    np.random.seed(epoch * n_batches + batch_index)  # not shown in the book

    indices = np.random.randint(m, size=batch_size)  # not shown

    X_batch = scaled_housing_data_plus_bias[indices] # not shown

    y_batch = housing.target.reshape(-1, 1)[indices] # not shown

    return X_batch, y_batch

#开始运行

with tf.Session() as sess:

    sess.run(init)

#每次都抽取新的数据做训练

    for epoch in range(n_epochs):

        for batch_index in range(n_batches):

            X_batch, y_batch = fetch_batch(epoch, batch_index, batch_size)

            sess.run(training_op, feed_dict={X: X_batch, y: y_batch})

#最终结果

    best_theta = theta.eval()

Saving and Restoring models（保存模型）

有时候，运行几天的模型可能因故暂时无法继续跑下去，因而需要暂时保持已训练好的部分模型到硬盘上。

init = tf.global_variables_initializer()

saver = tf.train.Saver()

#保存模型

with tf.Session() as sess:

    sess.run(init)

    for epoch in range(n_epochs):

        if epoch % 100 == 0:

            #print("Epoch", epoch, "MSE =", mse.eval())

            save_path = saver.save(sess, "/tmp/my_model.ckpt")

        sess.run(training_op)

    best_theta = theta.eval()

    save_path = saver.save(sess, "/tmp/my_model_final.ckpt")

#恢复模型

with tf.Session() as sess:

    saver.restore(sess, "/tmp/my_model_final.ckpt")

    best_theta_restored = theta.eval()

关于TensorBoard

众所周知，神经网络和机器学习大多是黑盒模型，让人有点忐忑。TensorBoard所起的功能就是将这个黑盒稍微变白一些~

启用tensorboard

输入docker ps查看当前容器id

进入容器

使用tensorboard --log-dir=tf_logs命令打开已经存入的tf_logs文件，其生成代码如下所示

from datetime import datetime

now = datetime.utcnow().strftime("%Y%m%d%H%M%S")

root_logdir = "tf_logs"

logdir = "{}/run-{}/".format(root_logdir, now)

...

mse_summary = tf.summary.scalar('MSE', mse)

file_writer = tf.summary.FileWriter(logdir, tf.get_default_graph())

...

if batch_index % 10 == 0:

                summary_str = mse_summary.eval(feed_dict={X: X_batch, y: y_batch})

                step = epoch * n_batches + batch_index

                file_writer.add_summary(summary_str, step)

【机器学习】TensorFlow学习（一）的更多相关文章

TensorFlow机器学习框架-学习笔记-001
# TensorFlow机器学习框架-学习笔记-001 ### 测试TensorFlow环境是否安装完成-----------------------------```import tensorflo ...
人工智能新手入门学习路线和学习资源合集（含AI综述/python/机器学习/深度学习/tensorflow）
[说在前面]本人博客新手一枚,象牙塔的老白,职业场的小白.以下内容仅为个人见解,欢迎批评指正,不喜勿喷![握手][握手] 1. 分享个人对于人工智能领域的算法综述:如果你想开始学习算法,不妨先了解人工 ...
Tensorflow学习笔记2019.01.22
tensorflow学习笔记2 edit by Strangewx 2019.01.04 4.1 机器学习基础 4.1.1 一般结构: 初始化模型参数:通常随机赋值,简单模型赋值0 训练数据:一般打乱 ...
Tensorflow学习笔记2019.01.03
tensorflow学习笔记: 3.2 Tensorflow中定义数据流图张量知识矩阵的一个超集. 超集:如果一个集合S2中的每一个元素都在集合S1中,且集合S1中可能包含S2中没有的元素,则集合S ...
TensorFlow学习笔记之--[compute_gradients和apply_gradients原理浅析]
I optimizer.minimize(loss, var_list) 我们都知道,TensorFlow为我们提供了丰富的优化函数,例如GradientDescentOptimizer.这个方法会自 ...
机器学习&深度学习基础（目录）
从业这么久了,做了很多项目,一直对机器学习的基础课程鄙视已久,现在回头看来,系统的基础知识整理对我现在思路的整理很有利,写完这个基础篇,开始把AI+cv的也总结完,然后把这么多年做的项目再写好总结. ...
TensorFlow学习路径【转】
作者:黄璞链接:https://www.zhihu.com/question/41667903/answer/109611087来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明 ...
TensorFlow学习线路
如何高效的学习 TensorFlow 代码? 或者如何掌握TensorFlow,应用到任何领域? 作者:黄璞链接:https://www.zhihu.com/question/41667903/ans ...
深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识
深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识在tf第一个例子的时候需要很多预备知识. tf基本知识香农熵交叉熵代价函数cross-entropy 卷积神经网络 s ...
tensorflow学习笔记(2)-反向传播
tensorflow学习笔记(2)-反向传播反向传播是为了训练模型参数,在所有参数上使用梯度下降,让NN模型在的损失函数最小损失函数:学过机器学习logistic回归都知道损失函数-就是预测值和真 ...

随机推荐

开源纯C#工控网关+组态软件(三)加入一个新驱动：西门子S7
一. 引子首先感谢博客园:第一篇文章.第一个开源项目,算是旗开得胜.可以看到,项目大部分流量来自于博客园,码农乐园,名不虚传^^. 园友给了我很多支持,并提出了很好的改进意见.现加入屏幕分辨率自 ...
Spring读书笔记——bean加载
我们的日常开发几乎离不开Spring,他为我们的开发带来了很大的便捷,那么Spring框架是如何做到方便他人的呢.今天就来说说bean如何被加载加载. 我们在xml文件中写过太多类似这样的bean声明 ...
Java面向对象正则表达式
Java面向对象正则表达式知识概要: (1)正则表达式的特点 (2)正则表达的匹配 (3)正则表达式的切割,替换,获取 (4)正则表达式的练习正则表达式:符合 ...
[js高手之路]封装运动框架实战左右与上下滑动的焦点轮播图
在这篇文章[js高手之路]打造通用的匀速运动框架中,封装了一个匀速运动框架,我们在这个框架的基础之上,加上缓冲运动效果,然后用运动框架来做幻灯片(上下,左右),效果如下: 1 2 3 4 5 // 0 ...
CSS盒子模型之详解
前言: 盒子模型是css中最核心的基础知识,理解了这个重要的概念才能更好的排版,进行页面布局.一.css盒子模型概念 CSS盒子模型又称框模型 (Box Model) ,包含了元 ...
C#利用String类的IndexOf、LastIndexOf、Substring截取字符串
一.String.IndexOf String.IndexOf 方法 (Char, Int32, Int32)报告指定字符在此实例中的第一个匹配项的索引(从0开始).搜索从指定字符位置开始,并检查指定 ...
Prometheus 架构 - 每天5分钟玩转 Docker 容器技术（83）
Prometheus 是一个非常优秀的监控工具.准确的说,应该是监控方案.Prometheus 提供了监控数据搜集.存储.处理.可视化和告警一套完整的解决方案. 让我们先来看看 Prometheus ...
WPF 只允许打开一个实例
我们有时候只希望我们的程序只打开一个实例,也就是我们的软件只有一次被打开. 那么我们可以通过一个办法知道,在这个软件打开前是不是打开过一个,还没关闭.也就是是否存在另一个程序在运行. 下面是一个简单方 ...
win10 uwp 设置启动窗口大小获取窗口大小
本文主要说如何设置我们窗口的启动大小,UWP启动窗口大小. 设置启动窗口设置窗口大小 ApplicationView.PreferredLaunchViewSize = new Size(1000, ...
javascript面向对象的写法及jQuery面向对象的写法
文章由来:jQuery源码学习时的总结在JS中,一般的面向对象的写法如下: function Cao(){}//定义一个构造函数 Cao.prototype.init = function(){}/ ...

【机器学习】TensorFlow学习（一）

【机器学习】TensorFlow学习（一）的更多相关文章

随机推荐

热门专题