tensorflow 读取训练集文件 from Hadoop

1、代码配置

filename_queue = tf.train.string_input_producer([

    "hdfs://namenode:8020/path/to/file1.csv",

    "hdfs://namenode:8020/path/to/file2.csv",

])

filename_queue = tf.train.string_input_producer([

    "hdfs://namenode:9000/path/to/file1.tfrecord",

    "hdfs://namenode:9000/path/to/file2.tfrecord",

])


def read_tfrecords(filename_queue):
    key, serialized_example = reader.read(filename_queue)

    features = tf.parse_single_example(

        serialized_example,

        features={

            'label': tf.FixedLenFeature(shape=[label_dims], dtype=data_type),

            'image': tf.FixedLenFeature(shape=[steps * width * height * channels], dtype=tf.float32)

        }

    )

    label = features['label']

    image = features['image']

    return image, label

2、环境配置

　  JAVA_HOME

　　HADOOP_HFDS_HOME

　　LD_LIBRARY_PATH 

　　CLASSPATH

eg：

　　vi ~/.bashrc

export JAVA_HOME=/home/user/java/jdk1..0_05

export HADOOP_HDFS_HOME=/home/user/software/hadoop-2.7./

export PATH=$PATH:$HADOOP_HDFS_HOME/libexec/hadoop-config.sh

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$JAVA_HOME/jre/lib/amd64/server

export PATH=$PATH:$HADOOP_HDFS_HOME/bin:$HADOOP_HDFS_HOME/sbin

export CLASSPATH="$(hadoop classpath --glob)"

　　source ~/.bashrc

3、使用

　　此时就可以访问Hadoop系统上的文件了　　file = "hdfs://namenode:8020/path/to/file1.tfrecords",

　　python your_script.py

参考文件

https://medium.com/@matthewyeung/hadoop-file-system-with-tensorflow-dataset-api-13ce9aeaa107

https://github.com/tensorflow/examples/blob/master/community/en/docs/deploy/hadoop.md

tensorflow 读取训练集文件 from Hadoop的更多相关文章

tensorflow读取训练数据方法
1. 预加载数据 Preloaded data # coding: utf-8 import tensorflow as tf # 设计Graph x1 = tf.constant([2, 3, 4] ...
第十二节，TensorFlow读取数据的几种方法以及队列的使用
TensorFlow程序读取数据一共有3种方法: 供给数据(Feeding): 在TensorFlow程序运行的每一步, 让Python代码来供给数据. 从文件读取数据: 在TensorFlow图的起 ...
利用VGG19实现火灾分类(附tensorflow代码及训练集)
源码地址 https://github.com/stephen-v/tensorflow_vgg_classify 1. VGG介绍 1.1. VGG模型结构 1.2. VGG19架构 2. 用Ten ...
利用卷积神经网络(VGG19)实现火灾分类(附tensorflow代码及训练集)
源码地址 https://github.com/stephen-v/tensorflow_vgg_classify 1. VGG介绍 1.1. VGG模型结构 1.2. VGG19架构 2. 用Ten ...
如何用Tensorflow训练模型成pb文件和和如何加载已经训练好的模型文件
这篇薄荷主要是讲了如何用tensorflow去训练好一个模型,然后生成相应的pb文件.最后会将如何重新加载这个pb文件. 首先先放出PO主的github: https://github.com/ppp ...
Tensorflow读取文件到队列文件
TensorFlow读取二进制文件数据到队列 2016-11-03 09:30:00 0个评论来源:diligent_321的博客收藏我要投稿 TensorFlow是一种 ...
在C#下使用TensorFlow.NET训练自己的数据集
在C#下使用TensorFlow.NET训练自己的数据集今天,我结合代码来详细介绍如何使用 SciSharp STACK 的 TensorFlow.NET 来训练CNN模型,该模型主要实现图像的分 ...
从一到二：利用mnist训练集生成的caffemodel对mnist测试集与自己手写的数字进行测试
通过从零到一的教程,我们已经得到了通过mnist训练集生成的caffemodel,主要包含下面四个文件: 接下来就可以利用模型进行测试了.关于测试方法按照上篇教程还是选择bat文件,当然python. ...
利用Tensorflow读取二进制CIFAR-10数据集
使用Tensorflow读取CIFAR-10二进制数据集觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 Tensorflow官方文档 tf.transpose函数解析 tf.sli ...

随机推荐

这台计算机上缺少此项目引用的 NuGet 程序包。使用“NuGet 程序包还原”可下载这些程序包
将项目复制到其地方的时候编译会报错,按照官网方法也不行,从网上查了一个有用的方法如下打开CSPROJ文件.删除如下代码, <Import Project="..\packages\ ...
Golang函数-函数的基本概念
Golang函数-函数的基本概念作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.函数的概述 1>.函数定义语法格式 Go语言函数定义格式如下: func 函数名( 函数参 ...
HDU - 6197 array array array （最长上升子序列&最长下降子序列）
题意:对于一个序列,要求去掉正好K个数字,若能使其成为不上升子序列或不下降子序列,则“A is a magic array.”,否则"A is not a magic array.\n&qu ...
c#查看本机网络端口和对应的程序名
360安全卫士里面有个组件叫流量防火墙,感觉挺好用,但是不想安装360全家桶,于是自己捣鼓着用C#写一个比较简化的版本. 查看电脑上开启的TCP或UDP端口,可以用netstat命令,netstat用 ...
指令——rm
一个完整的指令的标准格式: Linux通用的格式——#指令主体(空格) [选项](空格) [操作对象] 一个指令可以包含多个选项,操作对象也可以是多个. 指令:rm (remove,移除.删除) 作用 ...
cf 763B. Timofey and rectangles
%%题解,脑洞好大啊. 四色定理什么鬼的..所以一定是yes. 因为矩形边长都是奇数,所以可以按左下角分类,一共4类,分别1,2,3,4就可以了. (需要4种颜色的情况大概就是4个矩形围起来一个矩形) ...
JAVA的控制结构
一.控制结构 1.控制结构概述控制结构是控制程序如何运行的特殊的语句结构.控制结构可以分为:顺序控制结构,分支控制结构和循环控制结构. 2.顺序控制结构除了分支控制结构和循环控制结构之外的语句都是 ...
sudo 提权漏洞（CVE-2019-14287）复现（10.16 第二十二天）
sudo是Linux系统命令,让普通账号以root身份去执行某些命令,比,安装软件.查看某些配置文件.关机.重启等操作,如果普通账号需要使用sudo需要修改配置文件/etc/sudoers,将sudo ...
P1012 数字分类
转跳点:

tensorflow 读取训练集文件 from Hadoop

tensorflow 读取训练集文件 from Hadoop的更多相关文章

随机推荐

热门专题