tensorflow 批次读取文件内的数据，并将顺序随机化处理. --[python]

使用tensorflow批次的读取预处理之后的文本数据，并将其分为一个迭代器批次：

比如此刻，我有一个处理之后的数据包： data.csv shape =(8,10)，其中这个结构中，前五个列为feature , 后五列为label

1,2,3,4,5,6,7,8,9,10

11,12,13,14,15,16,17,18,19,20

21,22,23,24,25,26,27,28,29,30

31,32,33,34,35,36,37,38,39,40

41,42,43,44,45,46,47,48,49,50

51,52,53,54,55,56,57,58,59,60

1,1,1,1,1,2,2,2,2,2

3,3,3,3,3,4,4,4,4,4

现在我需要将其分为4个批次：也就是每个批次batch的大小为2

然后我可能需要将其顺序打乱,所以这里提供了两种方式，顺序和随机

#!/usr/bin/env python

# -*- coding: utf-8 -*-

__author__ = 'xijun1'

import tensorflow as tf

import numpy as np

# data = np.arange(1, 100 + 1)

# print ",".join( [str(i) for i in data])

# data_input = tf.constant(data)

filename_queue = tf.train.string_input_producer(["data.csv"])

reader = tf.TextLineReader(skip_header_lines=0)

key, value = reader.read(filename_queue)

# decode_csv will convert a Tensor from type string (the text line) in

# a tuple of tensor columns with the specified defaults, which also

# sets the data type for each column

words_size = 5  # 每一行数据的长度

decoded = tf.decode_csv(

    value,

    field_delim=',',

    record_defaults=[[0] for i in range(words_size * 2)])

batch_size = 2 # 每一个批次的大小

# 随机

batch_shuffle = tf.train.shuffle_batch(decoded, batch_size=batch_size,

                                       capacity=batch_size * words_size,

                                       min_after_dequeue=batch_size)

#顺序

batch_no_shuffle = tf.train.batch(decoded, batch_size=batch_size, capacity=batch_size * words_size,

                                  allow_smaller_final_batch=batch_size)

shuffle_features = tf.transpose(tf.stack(batch_shuffle[0:words_size]))

shuffle_label = tf.transpose(tf.stack(batch_shuffle[words_size:]))

features = tf.transpose(tf.stack(batch_no_shuffle[0:words_size]))

label = tf.transpose(tf.stack(batch_no_shuffle[words_size:]))

with tf.Session() as sess:

    coord = tf.train.Coordinator()

    threads = tf.train.start_queue_runners(coord=coord)

    for i in range(8/batch_size):

        print (i+10, sess.run([shuffle_features, shuffle_label]))

        print (i, sess.run([features, label]))

    coord.request_stop()

    coord.join(threads)

当我们运行的时候，我们可以得到这个结果：

(10, [array([[ 1,  2,  3,  4,  5],

       [31, 32, 33, 34, 35]], dtype=int32), array([[ 6,  7,  8,  9, 10],

       [36, 37, 38, 39, 40]], dtype=int32)])

(0, [array([[11, 12, 13, 14, 15],

       [21, 22, 23, 24, 25]], dtype=int32), array([[16, 17, 18, 19, 20],

       [26, 27, 28, 29, 30]], dtype=int32)])

(11, [array([[51, 52, 53, 54, 55],

       [ 3,  3,  3,  3,  3]], dtype=int32), array([[56, 57, 58, 59, 60],

       [ 4,  4,  4,  4,  4]], dtype=int32)])

(1, [array([[41, 42, 43, 44, 45],

       [ 1,  1,  1,  1,  1]], dtype=int32), array([[46, 47, 48, 49, 50],

       [ 2,  2,  2,  2,  2]], dtype=int32)])

(12, [array([[ 3,  3,  3,  3,  3],

       [11, 12, 13, 14, 15]], dtype=int32), array([[ 4,  4,  4,  4,  4],

       [16, 17, 18, 19, 20]], dtype=int32)])

(2, [array([[ 1,  2,  3,  4,  5],

       [21, 22, 23, 24, 25]], dtype=int32), array([[ 6,  7,  8,  9, 10],

       [26, 27, 28, 29, 30]], dtype=int32)])

(13, [array([[31, 32, 33, 34, 35],

       [ 1,  1,  1,  1,  1]], dtype=int32), array([[36, 37, 38, 39, 40],

       [ 2,  2,  2,  2,  2]], dtype=int32)])

(3, [array([[41, 42, 43, 44, 45],

       [ 1,  1,  1,  1,  1]], dtype=int32), array([[46, 47, 48, 49, 50],

       [ 2,  2,  2,  2,  2]], dtype=int32)])

tensorflow 批次读取文件内的数据，并将顺序随机化处理. --[python]的更多相关文章

TensorFlow csv读取文件数据（代码实现）
TensorFlow csv读取文件数据(代码实现) 大多数人了解 Pandas 及其在处理大数据文件方面的实用性.TensorFlow 提供了读取这种文件的方法. 前面章节中,介绍了如何在 Tens ...
HDFS读文件过程分析：读取文件的Block数据
转自http://shiyanjun.cn/archives/962.html 我们可以从java.io.InputStream类中看到,抽象出一个read方法,用来读取已经打开的InputStrea ...
C语言读取文件中特定数据
//读取文件数据 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<stdlib.h> struct jia ...
python读取文件内的IP信息练习
代码如下: #导包 import fileinput import re def readArw(): for line in fileinput.input(r"G:/raw.txt&qu ...
C语言：字符串读取流读取文件中的数据
#include<stdio.h> int main() { //定义文件指针 FILE *f = NULL; //打开文件 f = fopen("1.txt",&qu ...
Android - 读取文件存储的数据
存取手机中的文件数据. 写入和读取的操作格式均为UTF-8. import java.io.File; import java.io.FileInputStream; import java.io.F ...
fprintf写入字符串入文件/fread读取文件内的字符串
#include <stdio.h> #include <string.h> #include <stdlib.h> int main(void) { FILE * ...
EasyExcel读取文件-同步处理数据
读取代码 // 前端传过来的文件 MultipartFile file; InputStream inputStream = file.getInputStream(); // 读取excel数据,边 ...
JAVA流读取文件并保存数据
如图有文本如下数据写方法读取数据 private String[][] getData(){ // 使用ArrayList来存储每行读取到的字符串 ArrayList<String> a ...

随机推荐

h5 rem js自动适配
(function (doc, win) { var docEl = doc.documentElement, resizeEvt = 'orientationchange' in window ? ...
Flume配置文件写法总结
一.agent 第一步是定义agent(代理)及agent下的sources.channels.sinks的简称,如下: a1.sources = r1 a1.sinks = k1 a1.channe ...
HDU 4135 Co-prime (容斥+分解质因子)
<题目链接> 题目大意: 给定区间[A,B](1 <= A <= B <= 10 15)和N(1 <=N <= 10 9),求出该区间中与N互质的数的个数. ...
byte ---> hex String
public static String byte2HexString(byte[] b){ String ret = ""; ;i<b.lenght;i++){ Strin ...
UVA 1590 IP Networks JAVA
题意:输入m代表接下来的数据个数,计算接下来输入数据的网络掩码,和最小网络地址. 思路:①子网掩码:先将数据转为二进制,判断从哪一位开始有数据不一样,记下下标index,则子网掩码是index的前面是 ...
[OC]时间格式中的字符的意义
Letter Date or Time Component Presentation Examples G Era designator Text AD y Year Year 1996;96 M M ...
JAVA导入表格功能总结
表格结构: SheetName:sheet名称(辅材采购申请单) RowNum:行数 FirstCellNum/LastCellNum:第一竖列/最后一竖列(从0开始),例:getCell(0) = ...
BZOJ.3293.[CQOI2011]分金币(思路)
3293 双倍经验 1045 先考虑能否断环为链.显然是可以的,因为金币不可能在整个环上平移.所以我们枚举断点\(k\),表示\(k\)和\(k+1\)之间不交换金币. 令\(d_i=a_i-aver ...
数学——Euler方法求解微分方程详解（python3）
算法的数学描述图解实例用Euler算法求解初值问题 \[ \frac{dy}{dx}=y+\frac{2x}{y^2}\] 初始条件\(y(0)=1\),自变量的取值范围\(x \in [0, 2 ...
[JOISC2014]電圧
[JOISC2014]電圧题目大意: 一个\(n(n\le10^5)\)个点,\(m(m\le2\times10^5)\)条边的无向图.要在图中找到一条边,满足去掉这条边后,剩下的图是一个二分图,且 ...

tensorflow 批次读取文件内的数据，并将顺序随机化处理. --[python]

tensorflow 批次读取文件内的数据，并将顺序随机化处理. --[python]的更多相关文章

随机推荐

热门专题