tensorflow,torch tips

apply weightDecay,L2 REGULARIZATION_LOSSES

weights = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES)

for w in weights:

    print(w)

l2r = tf.contrib.layers.l2_regularizer(0.001)

tf.contrib.layers.apply_regularization(l2r,weights)

tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES)

##cross_entropy loss

tf.add_to_collection('losses', cross_entropy_mean)

loss = tf.add_n(tf.get_collection('losses'), name='cross_entropy_loss')

# config optimizer
target_loss = target_loss + tf.add_n(tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES),name='l2_loss')
train_step = tf.train.AdamOptimizer(
learning_rate).minimize(target_loss,global_step)

.learningRateDecay

global_step = tf.Variable(0, trainable=False,name = 'global_step')

learning_rate = tf.train.exponential_decay(opts.learning_rate, global_step, 10000, 0.96, staircase=True)

train_step = tf.train.AdamOptimizer(learning_rate).minimize(target_loss,global_step)

tensorflow 与torch 中 learningRateDecay的差异

torch:

 -- (3) learning rate decay (annealing)

   local clr = lr / (1 + state.t*lrd)

   state.t = state.t + 1

https://github.com/torch/optim/blob/master/adam.lua

tensorflow:

decayed_learning_rate = learning_rate *

                        decay_rate ^ (global_step / decay_steps)

https://www.tensorflow.org/versions/r0.11/api_docs/python/train/decaying_the_learning_rate

torch中是每个batch执行一次，如果lrd = 0.001

tensorflow 对应的应该是：decay_steps设为1，decay_steps = 1-lrd=0.999，这样就与torch的方法近似了？

不对，tesorflow中有等价的tf.train.inverse_time_decay

tensorflow 中的softmax与torch 中LogSoftmax

tf.nn.softmax

 exp(logits) / reduce_sum(exp(logits), dim)

tf.log(tf.nn.softmax(logits))并不与torch的LogSoftmax,torch中的LogSoftmax实现方式不一样：

https://github.com/torch/nn/blob/master/lib/THNN/generic/LogSoftMax.c

http://blog.csdn.net/lanchunhui/article/details/51248184

saver

http://www.jianshu.com/p/8487db911d9a

tensorflow 与torch 中 DropOut的差异

torch:

Furthermore, the outputs are scaled by a factor of 1/(1-p) during training. 

tensorflow:

With probability keep_prob, outputs the input element scaled up by 1 / keep_prob, otherwise outputs 0. The scaling is so that the expected sum is unchanged.

所以torch中的dropout_rate = p,相当于tesnsorflow中的keep_prob = 1-p

参数顺序

conv:torch outputs*inputs*kh*kw , tf kh*kw*inputs*outputs

deconv:torch inputs*outputs*kh*kw , tf kh*kw*outputs*inputs

移动端&MPS: outputs*kh*kw*inputs ，注意deconv kh*kw rotate 180度

tensorflow,torch tips的更多相关文章

『TensorFlow』专题汇总
TensorFlow:官方文档 TensorFlow:项目地址本篇列出文章对于全零新手不太合适,可以尝试TensorFlow入门系列博客,搭配其他资料进行学习. Keras使用tf.Session训 ...
【深度学习Deep Learning】资料大全
最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books by Yoshua Bengio, Ian Goodfellow and Aaron C ...
机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)
##机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)---#####注:机器学习资料[篇目一](https://github.co ...
（转）Awesome Human Pose Estimation
Awesome Human Pose Estimation 2018-10-08 11:02:35 Copied from: https://github.com/cbsudux/awesome-hu ...
8.8 Deep Learning Software
深度学习软件 -CPU vs GPU -Deep Learning Framework - Caffe / Caffe2 - Theano / TensorFlow - Torch / PyTorch ...
opencv::DNN介绍
DNN模块介绍: Tiny-dnn模块支持深度学习框架 - Caffe - TensorFlow - Torch/PyTorch DNN运用图像分类对象检测实时对象检测图像分割预测视频对 ...
YOLO---近段时间的练习目标
YOLO---近段时间的练习目标 yolo(darknet)官方主页:https://pjreddie.com/darknet/yolo/ 和在学校时用的不太一样了,有更新了- 还有一个常用版本: ...
【opencv系列01】OpenCV4.X介绍与安装
一.介绍 OpenCV(开源计算机视觉库:http://opencv.org)是英特尔开源的一个跨平台计算机视觉的BSD许可库,包含数百种计算机视觉算法.OpenCV由Gary Bradsky于199 ...
CS231n 斯坦福李飞飞视觉识别课程
本文是个人在学习<CS231n 斯坦福李飞飞视觉识别课程>的学习笔记. 第一讲:课程简介课时1 计算机视觉概述课时2 计算机视觉历史背景课时3 课程后勤选读书籍<DeepLe ...

随机推荐

JavaScript中的跨域问题
跨域问题其实很普遍的存在的,如何解决跨域问题呢,跨域问题到底是怎么产生的,解决方法的由来又是什么?我觉得看了视频讲解,值得写下来,记录下来. 一.跨域问题是怎么产生? 概念:只要协议.域名.端口有任何 ...
[C#] 对List进行分组排序后输出
Student 类: public class Student { public int ID { get; set; } public string Name { get; set; } publi ...
微信小程序（template的使用）
小程序的template是一个模版功能,在创建一个template后,其他的页面可以引用,相比component较简单.方便! template只需要两个文件,一个wxss文件和wxml文件,也只有这 ...
vue -vantUI tab切换时 list组件不触发load事件解决办法
最近由于公司项目需要,用vue写了几个简单的页面.用到了vantUI List 列表瀑布流滚动加载,用于控制长列表的展示当列表即将滚动到底部时,会触发事件并加载更多列表项. (页面加载完成后默认会 ...
笔试算法题（03）：最小第K个数 & 判定BST后序序列
出题:输入N个整数,要求输出其中最小的K个数: 分析: 快速排序和最小堆都可以解决最小(大)K个数的问题(时间复杂度为O(NlogN)):另外可以建立大小为K的最大堆,将前K个数不断插入最大堆,对于之 ...
MySQL-----连表
连表: **拿到两张表的信息** select * from userinfo,department 弊端是数据会乱,出现重复,不建议这样. **使userinfo表的part_id列与departm ...
scrapy爬取简书整站文章
在这里我们使用CrawlSpider爬虫模板, 通过其过滤规则进行抓取, 并将抓取后的结果存入mysql中,下面直接上代码: jianshu_spider.py # -*- coding: utf-8 ...
stark组件之添加、修改页面内容搭建（七）
如何快速的进行数据的添加以及修改呢?modelform来实现是可以达到效果的,在这里就是应用了modelform,每一个表都不同,所以需要创建不同的modelform. def get_model_f ...
Codeforce 810C Do you want a date?
题意: 给定n个不重复的数, 求出这些数的所有子集, 然后设一个数Ni 为第i个子集中,最大的数 - 最小的数. 然后将i个 Ni求和, 结果mod 1e9 + 7. 分析: 首先将n个数排列,生成 ...
STM32F407 按键输入实验库函数版个人笔记
读取IO口输入的函数: STM32F4 的 IO口做输入使用的时候,是通过调用函数 GPIO_ReadInputDataBit()来读取 IO 口的状态的.了解了这点,就可以开始我们的代码编写了. 按 ...

tensorflow,torch tips

tensorflow,torch tips的更多相关文章

随机推荐

热门专题