TensorFlow总结
第一 基础
1. 定义变量
#定义维度为[2,3], 平均值为·1, 标准差为1,类型为float32,名称为w1的服从正态分布的变量
w1 = tf.Variable(tf.random_normal(2, 3), stddev=1, seed=1, dtype=tf.float32, name='w1')
#定义维度为[2,3],平均值为1,标准差为1,类型为float32,名称为w1的服从正态分布的变量,偏离平均值超过两个标准差则重新生成
w1 = tf.Variable(tf.truncated_normal(2, 3), stddev=1, seed=1, dtype=tf.float32, name='w1')
2.定义常量
#定义值为[[1,2], [4,5]], 类型为float32, 名称为x的常量
x = tf.constant([[1, 2], [4, 5]], dtype=tf.float32, name='x')
3.定义占位符
#定义类型为float32,维度为[None, 2], 名称为x的占位符
x = tf.placeholder(tf.float32, shape=(None, 2), name='x')
4.开启回话
init_op = tf.initialize_all_variables()
with tf.Session() as sess:
sess.run(init_op)
第二 优化
1.非线性与激活函数
INPUT_NODE = 2
OUTPUT_NODE = 1
LAYER1_NODE = 3
x = tf.placeholder(tf.float32, shape=(None, INPUT_NODE), name='x-input')
_y = tf.placeholder(tf.float32, shape=(None, OUTPUT_NODE), name='y-output')
weight1 = tf.Variable(tf.truncated_normal(INPUT_NODE, LAYER1_NODE), dtype=tf.float32, name='weight1')
biases1 = tf.Variable(tf.constant(0.1, shape=LAYER1_NODE), dtype=tf.float32, name='biases1')
weight2 = tf.Variable(tf.truncated_normal(LAYER1_NODE, OUTPUT_NODE), dtype=tf.float32, name='weight2')
biases2 = tf.Variable(tf.constant(0.1, shape=OUTPUT_NODE), dtype=tf.float32, name='biases2')
layer1 = tf.nn.relu(tf.matmul(x, weight1) + biases1)
y = tf.matmul(layer1, weight2) + biases2
2.交叉熵损失函数
(1)不封装写法
cross_entropy = -tf.reduce_mean(_y * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
(2)封装写法
cross_entropy = tf.nn.softmax_cross_entropy_with_logits(y, _y)
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
3.均方误差损失函数
mse = tf.reduce_mean(tf.square(_y - y))
train_step = tf.train.AdamOptimizer(0.001).minimize(mse)
4.自定义损失函数
LOSS_MORE = 10
LOSS_LESS = 1
loss = tf.reduce_sum(tf.select(tf.greater(y, _y), (y- _y) * LOSS_MORE, (_y - y) * LOSS_LESS))
train_step = tf.train.AdamOptimizer(0.001).minimize(loss)
5.指数衰减学习率
LEARNING_RATE_BASE = 0.1
LEARNING_RATE_DECAY = 0.99
ALL_SIZE = 10000
BATCH_SIZE = 10
global_step = tf.Variable(0, trainable=False)
learning_rate = tf.train.exponential_decay(LEARNING_RATE_BASE, global_step, ALL_SIZE/BATCH_SIZE, LEARNING_RATE_DECAY)
train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss, global_step=global_step)
6.过拟合问题与正则化
REGULARIZATION_RATE = 0.0001
regularizer = tf.contrib.layers.l2_regularizer(REGULARIZATION_RATE)
regularization = regularizer(weight1) + regularizer(weight2)
loss = cross_entropy + regularization
7.滑动平均模型
MOVING_AVERAGE_DECAY = 0.99
ema = tf.traim.ExponentialMovingAverage(MOVING_AVERAGE_DECAY, global_step)
ema_op = ema.apply(tf.trainable_variables())
TensorFlow总结的更多相关文章
- Tensorflow 官方版教程中文版
2015年11月9日,Google发布人工智能系统TensorFlow并宣布开源,同日,极客学院组织在线TensorFlow中文文档翻译.一个月后,30章文档全部翻译校对完成,上线并提供电子书下载,该 ...
- tensorflow学习笔记二:入门基础
TensorFlow用张量这种数据结构来表示所有的数据.用一阶张量来表示向量,如:v = [1.2, 2.3, 3.5] ,如二阶张量表示矩阵,如:m = [[1, 2, 3], [4, 5, 6], ...
- 用Tensorflow让神经网络自动创造音乐
#————————————————————————本文禁止转载,禁止用于各类讲座及ppt中,违者必究————————————————————————# 前几天看到一个有意思的分享,大意是讲如何用Ten ...
- tensorflow 一些好的blog链接和tensorflow gpu版本安装
pading :SAME,VALID 区别 http://blog.csdn.net/mao_xiao_feng/article/details/53444333 tensorflow实现的各种算法 ...
- tensorflow中的基本概念
本文是在阅读官方文档后的一些个人理解. 官方文档地址:https://www.tensorflow.org/versions/r0.12/get_started/basic_usage.html#ba ...
- kubernetes&tensorflow
谷歌内部--Borg Google Brain跑在数十万台机器上 谷歌电商商品分类深度学习模型跑在1000+台机器上 谷歌外部--Kubernetes(https://github.com/kuber ...
- tensorflow学习
tensorflow安装时遇到gcc: error trying to exec 'as': execvp: No such file or directory. 截止到2016年11月13号,源码编 ...
- 【转】TensorFlow练习20: 使用深度学习破解字符验证码
验证码是根据随机字符生成一幅图片,然后在图片中加入干扰象素,用户必须手动填入,防止有人利用机器人自动批量注册.灌水.发垃圾广告等等 . 验证码的作用是验证用户是真人还是机器人:设计理念是对人友好,对机 ...
- 【转】机器学习教程 十四-利用tensorflow做手写数字识别
模式识别领域应用机器学习的场景非常多,手写识别就是其中一种,最简单的数字识别是一个多类分类问题,我们借这个多类分类问题来介绍一下google最新开源的tensorflow框架,后面深度学习的内容都会基 ...
- 【转】Ubuntu 16.04安装配置TensorFlow GPU版本
之前摸爬滚打总是各种坑,今天参考这篇文章终于解决了,甚是鸡冻\(≧▽≦)/,电脑不知道怎么的,安装不了16.04,就安装15.10再升级到16.04 requirements: Ubuntu 16.0 ...
随机推荐
- 数据库迁移之mysql-redis.txt
一.mysql迁移数据到redis 关于redis+mysql应用: 微博当然是最大的redis集群了: 总结了基本流程: 1. 发微博– > 进入消息队列– > 存入MySQL– > ...
- JAVA Exception
博客背景音乐设置 晴天博客(酷)
- poj-1330(暴力写的lca)
传送门 一看就是lca的板子题 然而 (写这个的时候我忘了怎么写lca) 于是我就试着写暴力了 本以为会tle结果e了一次后居然a掉了 开心到起飞.嘿嘿嘿 但还是格式输出错误了一次而且在ce之前也de ...
- 剑指offer——链表中倒数第k个结点
输入一个链表,输出该链表中倒数第k个结点. class Solution { public: ListNode* FindKthToTail(ListNode* pListHead, unsigned ...
- AI VGG16
VGG(Visual Geometry Group) 16 参考链接: https://arxiv.org/abs/1409.1556
- linux内存源码分析 - 伙伴系统(释放页框)
本文为原创,转载请注明:http://www.cnblogs.com/tolimit/ 翻了一下之前的文章,发现竟然忘记写内核是如何释放页框的,罪过. 释放页框很简单,其实只有几步 检查此页是否被其他 ...
- 如何在自定义Filter中优雅的实现静态资源放行
在javaweb开发中,过滤器Filter比较常用于类似登录的拦截等场景.但是,当过滤器的配置不当时就会把所有的请求都拦截,静态资源也会被拦截掉,导致静态页面加载不出来. 一般的解决方 ...
- 用Java执行Python:Jython踩坑笔记
常见的java调用python脚本方式 1.通过Jython.jar提供的类库实现 2.通过Runtime.getRuntime()开启进程来执行脚本文件 1.Jython Jpython使用时,版本 ...
- Item 26: 避免对universal引用进行重载
本文翻译自<effective modern C++>,由于水平有限,故无法保证翻译完全正确,欢迎指出错误.谢谢! 博客已经迁移到这里啦 如果你需要写一个以名字作为参数,并记录下当前日期和 ...
- LNK2022: 元数据操作失败(8013118D): 重复类型(FactoryContext)中的布局信息不一致: (0x02000230)
1. c++项目 A 编译成A.lib文件 2. c++项目B引用这个A.lib文件 3. A项目存在一个类跟B项目一样,但是A项目其他文件需要这个类里面的某些东西,我将不需要的全部注释掉,然后编译A ...