机器学习中的python常用函数
lstrip()方法
lstrip() 方法用于截掉字符串左边的空格或指定字符
str.lstrip([chars]) 截掉指定的字符char
返回截掉指定字符的字符串
str = " this is string example....wow!!! ";
print( str.lstrip() );# this is string example....wow!!!
str = "88888888this is string example....wow!!!8888888";
print( str.lstrip('') ); # this is string example....wow!!!8888888
random.seed()
放一个改变随机数生成器的种子,每个seed()值对应着一个固定的随机操作(生成随机数、随机洗牌)
import random
x :改变随机数生成器的种子seed。如果不设置,Python会帮你选择seed值。
import random random.seed(10) # 生成同一个随机数
print("带种子的随机数10: ", random.random())
# 带种子的随机数10: 0.57140259469 random.seed(10) # 生成同一个随机数
print("带种子的随机数10: ", random.random())
# 带种子的随机数10 10 : 0.57140259469
random.shuffle()
将序列的所有元素随机排序。
import random
random.shuffle(lit)
import random lit = [20, 16, 10, 5] random.shuffle(lit)
print("随机排序列表 : ", lit) # 随机排序列表 : [20, 10, 5, 16]
tf.cast()
tf.cast(x, dtype, name=None)
将x的数据格式转化成dtype,例如,原来x的数据格式是bool,那么将其转化成float以后,就能将其转化成 0 和 1 的序列
import tensorflow as tf a = tf.Variable([1,0,0,1,1])
b = tf.cast(a,dtype=tf.bool)
sess = tf.Session()
sess.run(tf.initialize_all_variables())
print(sess.run(b))
#[ True False False True True]
tf.concat
tf.concat相当于numpy中的np.concatenate函数,用于将两个张量在某一维度(axis)合并起来,
a = tf.constant([[1,2,3],[3,4,5]]) # shape (2,3)
b = tf.constant([[7,8,9],[10,11,12]]) # shape (2,3)
ab1 = tf.concat([a,b], axis=0) # shape(4,3)
ab2 = tf.concat([a,b], axis=1) # shape(2,6)
tf.stack
tf.stack 产生新的阶,并进行拼接张量,增加维度
a = tf.constant([[1,2,3],[3,4,5]]) # shape (2,3)
b = tf.constant([[7,8,9],[10,11,12]]) # shape (2,3)
ab = tf.stack([a,b], axis=0) # shape (2,2,3)
axis是决定其层叠(stack)张量的维度方向的,改变参数axis=2
import tensorflow as tf
a = tf.constant([[1,2,3],[3,4,5]]) # shape (2,3)
b = tf.constant([[7,8,9],[10,11,12]]) # shape (2,3)
ab = tf.stack([a,b], axis=2) # shape (2,3,2)
tf.unstack
tf.unstack与tf.stack的操作相反,是将一个高阶数的张量在某个axis上分解为低阶数的张量
a = tf.constant([[1,2,3],[3,4,5]]) # shape (2,3)
b = tf.constant([[7,8,9],[10,11,12]]) # shape (2,3)
ab = tf.stack([a,b], axis=0) # shape (2,2,3) a1 = tf.unstack(ab, axis=0) # a1的输出为
# [<tf.Tensor 'unstack_1:0' shape=(2, 3) dtype=int32>,
# <tf.Tensor 'unstack_1:1' shape=(2, 3) dtype=int32>]
tf.transpose()函数
这个函数主要适用于交换输入张量的不同维度用,如果输入张量是二维,就相当是转置。如果张量是三维,就是用0,1,2来表示。这个列表里的每个数对应相应的维度。如果是[2,1,0],就把输入张量的第三维度和第一维度交换。
import tensorflow as tf
import numpy as np A = np.array([[1, 2, 3],
[4, 5, 6]])
print(A.shape) # (2,3)
x = tf.transpose(A, [1, 0])
print(x.shape) # (3,2) B = np.array([[[1, 2, 3, 4],
[5, 6, 7, 8],
[9, 10, 11, 12]], [[13, 14, 15, 16],
[17, 18, 19, 20],
[21, 22, 23, 24]]])
print(B.shape) # (2,3,4)
y = tf.transpose(B, [2, 1, 0])
print(y.shape) # (4,3,2)
enumerate()
enumerate() 函数用于将一个可遍历的数据对象组合为元组,同时返回数据下标和数据,一般用在 for 循环当中
seasons = ['Spring', 'Summer', 'Fall', 'Winter']
print(list(enumerate(seasons)))
# [(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')] seq = ['one', 'two', 'three']
for i, element in enumerate(seq):
print(i, element) # 0 one
# 1 two
# 2 three
zip()
将可迭代对象打包成一个个元组,然后返回包含这些元组的列表
语法:zip([iterable, ...])
a = [1, 2, 3]
b = [4, 5, 6]
c = [4, 5, 6, 7, 8]
zipped = zip(a, b) # 打包为元组的列表
# [(1, 4), (2, 5), (3, 6)]
zip(a, c) # 元素个数与最短的列表一致
# [(1, 4), (2, 5), (3, 6)]
zip(*zipped) # 与 zip 相反,*zipped 可理解为解压,返回二维矩阵式
# [(1, 2, 3), (4, 5, 6)]
tf.clip_by_global_norm理解
梯度剪裁一般的应用场景为
optimizer = tf.train.AdamOptimizer(self.learning_rate)
gradients, v = zip(*optimizer.compute_gradients(self.loss))
gradients, _ = tf.clip_by_global_norm(gradients, self.grad_clip)
updates_train_optimizer = optimizer.apply_gradients(zip(gradients, v), global_step=self.global_step)
梯度剪裁最直接的目的就是防止梯度暴躁,手段就是控制梯度的最大范式。
tf.clip_by_global_norm(t_list, clip_norm, use_norm=None, name=None)
参数:
- t_list:输入梯度
- clip_norm:裁剪率
- clip_norm:要使用的全球规范
返回:
- list_clipped:裁剪后的梯度列表
- global_norm:全局的规约数
但是,它比clip_by_norm()慢,因为在执行剪裁操作之前,必须准备好所有参数
tensorflow中的多线程管理
Tensorflow的Session对象支持多线程,可以在一个会话中创建多个线程,并执行,在Session中所有线程都必须同步终止。
Tensorflow提供两个类来实现对Session中多线程的管理,tf.Coordinator()和tf.QueueRunner(),往往一起使用
tf.Coordinator()类 用来停止Session中的多个工作线程,并且向那个在等待的工作线程 发送终止程序报告异常,该线程捕获到这个异常之后就会终止所有线程。使用 tf.train.Coordinator()来创建一个线程管理器(协调器)对象。
tf.QueueRunner()类 用来启动tensor的入队线程,可以用来启动多个线程同时将多个tensor训练数据推送到队列中,具体执行函数是tf.train.start_queue_runners
只有调用 tf.train.start_queue_runners 之后,才会真正把tensor推入内存序列中,供计算单元调用,否则会由于内存序列为空,数据流图会处于一直等待状态。
调用 tf.train.Coordinator 创建一个线程协调器,用来管理之后在Session中启动所有线程
调用 tf.train.start_queue_runners 启动入队线程,由多个或单个线程,按规则把文件读入Filename Queue中。
参考:tensorflow中协调器 tf.train.Coordinator 和入队线程启动器 tf.train.start_queue_runners
rand生成一个[0~1]之间2行100列的数组
randn生成服从正态分布的数组
tf.ConfigProto()
https://blog.csdn.net/lanchunhui/article/details/50163669
https://blog.csdn.net/dcrmg/article/details/79780331
https://www.cnblogs.com/adong7639/p/8136273.html
https://www.cnblogs.com/MY0213/p/9208503.html
https://blog.csdn.net/u011509971/article/details/70244688
tf.contrib.layers.xavier_initializer_conv2d
xavier_initializer初始化的基本思想是保持输入和输出的方差一致,这样就避免了所有的输出值都趋向于0。
这个初始化器是用来保持每一层的梯度大小都差不多相同。
机器学习中的python常用函数的更多相关文章
- Python常用函数记录
Python常用函数/方法记录 一. Python的random模块: 导入模块: import random 1. random()方法: 如上如可知该函数返回一个[0,1)(左闭右开)的一个随机的 ...
- 【PHP】最详细PHP从入门到精通(三)——PHP中的数组常用函数汇总
PHP从入门到精通 之PHP中的数组常用函数详解 数组作为PHP中最常用的结构之一,PHP强大的数组函数功能,给数组的相关操作带来了极大的便利.今天给大家介绍的PHP中数组函数,是PHP数组中重要的 ...
- php中文件操作常用函数有哪些
php中文件操作常用函数有哪些 一.总结 一句话总结:读写文件函数 判断文件或者目录是否存在函数 创建目录函数 file_exists() mkdir() file_get_content() fil ...
- python常用函数库收集。
学习过Python都知道python中有很多库.python本身就是万能胶水,众多强大的库/模块正是它的优势. 收集一些Python常用的函数库,方便大家选择要学习的库,也方便自己学习收集,熟悉运用好 ...
- Python常用函数、方法、模块记录
常用函数: 1.pow():乘方 2.abs():绝对值 3.round():四舍五入 4.int():转换为整数 5.input():键盘输入(会根据用户的输入来做类型的转换) raw_input( ...
- python常用函数年初大总结
1.常用内置函数:(不用import就可以直接使用) help(obj) 在线帮助, obj可是任何类型 callable(obj) 查看一个obj是不是可以像函数一样调用 repr(obj) 得到o ...
- python常用函数及模块
原文来源于博客园和CSDN 1.计算函数 abs()--取绝对值 max()--取序列最大值,包括列表.元组 min()--取序列最小值 len()--取长度 divmod(a,b)---取a//b除 ...
- python常用函数总结
原文地址https://www.cnblogs.com/nice107/p/8118876.html 我们在学习python的时候,接触最多的往往则是那些函数,对于python函数,在这里为大家总结归 ...
- 超级干货,python常用函数大总结
我们在学习python的时候,接触最多的往往则是那些函数,对于python函数,在这里为大家总结归纳了这些,如果有缺漏,还请及时留言指正哦! 话不多说,干货来袭! 1.常用内置函数:(不用import ...
随机推荐
- git submodule临时分支;以及git reset使用
submodule 已经建立好了一个gitlab submodule形式的repo: 在repo A下面有一个submodule B, A --> B. clone -b branch [rep ...
- JAVA技术分享:消失的线程
很多小伙伴都问过我一个问题,就是任务线程跑着跑着消失了,而且没有任何异常日志.我都是条件反射式的回复,是不是用了线程池的submit提交任务.而且很大几率对方给予肯定答复. 解决方案,很多人都听过不少 ...
- vue2.0 组件和v-model
本文适合初学组件编写的同学阅读. 乍一看这个标题,可能会有疑问:v-model和组件也能扯到一起? 我打算写这篇文章的时候,也是这么想的.咱们按简历的那一套STAR法则来梳理一下这篇文章: 情景[Si ...
- 谈一谈手机WebApp的fixed属性(手机上的固定栏)【转】
1.iphone/android原生app常见结构 似乎,所有的手机应用,都遵循这样的布局:固定的顶部+固定的底部+可滚动在中间区域.这种“雷同”的模式让人恶心,却不得不承认这是一种很规矩却又很实用的 ...
- 简单使用dom4j
package com.dom4j; import java.io.FileWriter; import java.io.IOException; import java.io.Unsupported ...
- python实现八大排序算法
插入排序 核心思想 插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中,从而得到一个新的.个数加一的有序数据,算法适用于少量数据的排序,时间复杂度为 O(n^2).是稳定的排序方法.插入算法 ...
- HTML页面每次打开的时候都清除页面缓存
解决办法为: (1) 用HTML标签设置HTTP头信息 <HEAD> <META HTTP-EQUIV="Pragma" CONTENT="no- ...
- 首次运行tensorflow-gpu 1.0 报错 failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED
发现博客: https://blog.csdn.net/u010752600/article/details/79534910 于是找到解决方法. sudo rm -rf ~/.nv/
- ZetCode PyQt4 tutorial basic painting
#!/usr/bin/python # -*- coding: utf-8 -*- """ ZetCode PyQt4 tutorial In this example, ...
- linux bash shell 判断目录是否为空的函数
#!/bin/sh ##方法一 判断输出字符数统计为0 is_empty_dir(){ |wc -w` } ##方法二 判断输出string为空 #is_empty_dir(){ # ` ] #} t ...