tensorflow 中的L1和L2正则化

import tensorflow as tf

weights = tf.constant([[1.0, -2.0],[-3.0 , 4.0]])

>>> sess.run(tf.contrib.layers.l1_regularizer(0.5)(weights))

5.0

>>> sess.run(tf.keras.regularizers.l1(0.5)(weights))

5.0

>>> sess.run(tf.keras.regularizers.l1()(weights))

0.099999994

>>> sess.run(tf.keras.regularizers.l1(1)(weights))

10.0

>>> sess.run(tf.nn.l2_loss(weights))

15.0

>>> sess.run(tf.keras.regularizers.l2(1)(weights))

30.0

>>> sess.run(tf.keras.regularizers.l2(0.5)(weights))

15.0

>>> sess.run(tf.contrib.layers.l1_regularizer(0.5)(weights))

5.0

>>> sess.run(tf.contrib.layers.l2_regularizer(0.5)(weights))

7.5

>>> sess.run(tf.contrib.layers.l2_regularizer(1.0)(weights))

15.0

在tensorflow中，tf.nn中只有tf.nn.l2_loss，却没有l1_loss，于是自己网上查阅资料，了解到tf.contrib.layers中有tf.contrib.layers.l1_regularizer(),但是tf.contrib目前新版本已经被弃用了，后来发现tf.keras.regularizers下面有l1和l2正则化器，但是该正则化器的l2有点不一样，从上面的结果可以看出，scale都为1时，它要多一倍。可以查看源代码，tf.nn.l2_loss和 tf.contrib.layers.l2_regularizer 中都统一除以了2.所以值要少一半。

>>> sess.run(tf.nn.l2_loss(weights))

15.0

>>> sess.run(tf.keras.regularizers.l2(1)(weights))

30.0

>>> sess.run(tf.contrib.layers.l2_regularizer(1.0)(weights))

15.0
将scale设为0.5后，可以得到一样的值，因此，以后在损失函数中可以使用这样的方式来求l2损失和l1损失。
>>> sess.run(tf.keras.regularizers.l2(0.5)(weights))
15.0

参考了  day-17 L1和L2正则化的tensorflow示例 - 派森蛙 - 博客园

https://www.cnblogs.com/python-frog/p/9416970.html

'''

输入：

x = [[1.0,2.0]]

w = [[1.0,2.0],[3,0,4.0]]

输出：

y = x*w = [[7.0,10.0]]

l1 = (1.0+2.0+3.0+4.0)*0.5 = 5.0

l2 = (1.0**2 + 2.0**2 + 3.0**2 + 4.0**2) / 2)*0.5 = 7.5

'''

import tensorflow as tf

from tensorflow.contrib.layers import *

w = tf.constant([[1.0,2.0],[3.0,4.0]])

x = tf.placeholder(dtype=tf.float32,shape=[None,2])

y = tf.matmul(x,w)

with tf.Session()  as sess:

    init = tf.global_variables_initializer()

    sess.run(init)

    print(sess.run(y,feed_dict={x:[[1.0,2.0]]}))

    print("=========================")

    print(sess.run(l1_regularizer(scale=0.5)(w)))

    #(1.0+2.0+3.0+4.0)*0.5 = 5.0

    print("=========================")

    print(sess.run(l2_regularizer(scale=0.5)(w)))

    #(1.0**2 + 2.0**2 + 3.0**2 + 4.0**2) / 2)*0.5 = 7.5

tensorflow 中的L1和L2正则化的更多相关文章

机器学习中的L1、L2正则化
目录 1. 什么是正则化?正则化有什么作用? 1.1 什么是正则化? 1.2 正则化有什么作用? 2. L1,L2正则化? 2.1 L1.L2范数 2.2 监督学习中的L1.L2正则化 3. L1.L ...
day-17 L1和L2正则化的tensorflow示例
机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作ℓ1-norm和ℓ2-norm,中文称作L1正则化和L2正则化,或者L1范数和L2范数.L2范数也被称为权重衰 ...
4.机器学习——统计学习三要素与最大似然估计、最大后验概率估计及L1、L2正则化
1.前言之前我一直对于“最大似然估计”犯迷糊,今天在看了陶轻松.忆臻.nebulaf91等人的博客以及李航老师的<统计学习方法>后,豁然开朗,于是在此记下一些心得体会. “最大似然估计” ...
深入理解L1、L2正则化
过节福利,我们来深入理解下L1与L2正则化. 1 正则化的概念正则化(Regularization) 是机器学习中对原始损失函数引入额外信息,以便防止过拟合和提高模型泛化性能的一类方法的统称.也就是 ...
L1 与 L2 正则化
参考这篇文章: https://baijiahao.baidu.com/s?id=1621054167310242353&wfr=spider&for=pc https://blog. ...
Spark2.0机器学习系列之12：线性回归及L1、L2正则化区别与稀疏解
概述线性回归拟合一个因变量与一个自变量之间的线性关系y=f(x). Spark中实现了: (1)普通最小二乘法 (2)岭回归(L2正规化) (3)La ...
L1与L2正则化的对比及多角度阐述为什么正则化可以解决过拟合问题
正则化是一种回归的形式,它将系数估计(coefficient estimate)朝零的方向进行约束.调整或缩小.也就是说,正则化可以在学习过程中降低模型复杂度和不稳定程度,从而避免过拟合的危险. 一. ...
L1与L2正则化
目录过拟合结构风险最小化原理正则化 L2正则化 L1正则化 L1与L2正则化参考链接过拟合机器学习中,如果参数过多.模型过于复杂,容易造成过拟合. 结构风险最小化原理在经验风险最小化(训 ...
L1、L2正则化详解
正则化是一种回归的形式,它将系数估计(coefficient estimate)朝零的方向进行约束.调整或缩小.也就是说,正则化可以在学习过程中降低模型复杂度和不稳定程度,从而避免过拟合的危险. 一. ...

随机推荐

javaIO笔记
原创 File类实例化 new File(path); File.separator 分隔符创建文件的常规做法
MOTS：多目标跟踪和分割论文翻译
MOTS:多目标跟踪和分割论文翻译摘要: 本文将目前流行的多目标跟踪技术扩展到多目标跟踪与分割技术(MOTS).为了实现这个目标,我们使用半自动化的标注为两个现有的跟踪数据集创建了密集的像素级标注. ...
关于java String类的getBytes(String charsetName)和String(byte[] bytes, String charsetName)
public byte[] getBytes(Charset charset) Encodes this String into a sequence of bytes using the given ...
python列表与元祖
python 的列表和元素: 共同点:有序的区别:1.列表可以修改增加删除列表内容,元组不能修改联系:元组中包含列表的元素,可以修改列表元素. 分析:1.列表:LIST1=[1,2,3,4,5,6 ...
TensorFlow 中的张量，图，会话
tensor的含义是张量,张量是什么,听起来很高深的样子,其实我们对于张量一点都不陌生,因为像标量,向量,矩阵这些都可以被认为是特殊的张量.如下图所示: 在TensorFlow中,tensor实际上就 ...
An enhance script to check partition tables under all schemas in sqlserver
Simple step for EMC NW & NMM (1) disable WINDOWS UAC (reboot)(2) SET windows domain user AS sysa ...
再次聚焦DOCKER MACHINE CODE 2048
如果有一种feeling让世界难以释怀,那一定是发掘(挖土机那家强?)了什么了不起的东西如果有一种贴图叫做深夜,仍不止息,那一定是饱含深意的贴图 // TODO: I'm not super hap ...
TomCat控制台中文乱码及IDEA设置为UTF-8
一.解决IDEA中的中文乱码 1.首先设置idea编辑器的编码: File-Setting设置如下 idea显示编码:windows默认用gbk所以idea显示默认为gbk编码,在 Help--Edi ...
jmeter与jdk的安装
1.第一步:下载jdk的安装包下载链接: http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151 ...
浅析word2vec（一）
1 word2vec 在自然语言处理的大部分任务中,需要将大量文本数据传入计算机中,用以信息发掘以便后续工作.但是目前计算机所能处理的只能是数值,无法直接分析文本,因此,将原有的文本数据转换为数值数据 ...

tensorflow 中的L1和L2正则化

tensorflow 中的L1和L2正则化的更多相关文章

随机推荐

热门专题