hadoop SequenceFile示例

1、写入，SequenceFile的key和value不一定是Writable，只要能被Serialization序列化和反序列化就可以。

 private static final String[] DATA = {

            "One, two, buckle my shoe",

            "Three, four, shut the door",

            "Five, six, pick up sticks",

            "Seven, eight, lay them straight",

            "Nine, ten, a big fat hen"

    };

 private static void writeSequenceFile(String[] args) throws IOException{

        String uri = args[];

        Configuration conf = new Configuration();

        Path path = new Path(uri);

        IntWritable key = new IntWritable();

        Text value = new Text();

        SequenceFile.Writer writer = null;

        SequenceFile.Writer.Option option1 = SequenceFile.Writer.file(path);

        SequenceFile.Writer.Option option2 = SequenceFile.Writer.keyClass(key.getClass());

        SequenceFile.Writer.Option option3 = SequenceFile.Writer.valueClass(value.getClass());

        SequenceFile.Writer.Option option4 = SequenceFile.Writer.compression(SequenceFile.CompressionType.RECORD);

        try {

            writer = SequenceFile.createWriter(conf,option1,option2,option3,option4);

            for (int i=;i<;i++){

                key.set(i+);

                value.set(DATA[i% DATA.length]);

                System.out.printf("[%s]\t%s\t%s\n",writer.getLength(), key,value);

                writer.append(key,value);
　　　　　　　　　 if(i%DATA.length==0)
   　　　　　　　　　 writer.sync();//写入同步点

            }

        }finally {

            IOUtils.closeStream(writer);

        }

    }

2、读取，如果key和value使用了Writable，使用next()方法就可以把数据读入到key和value中，对于非Writable的类型的序列化需要根据实际实现来判断。

 private static void readSequenceFile(String[] args) throws IOException{

        String uri = args[0];

        Configuration conf = new Configuration();

        Path path = new Path(uri);

        SequenceFile.Reader reader = null;

        SequenceFile.Reader.Option option1 = SequenceFile.Reader.file(path);

        try {

            reader = new SequenceFile.Reader(conf,option1);

            Writable key = (Writable) ReflectionUtils.newInstance(reader.getKeyClass(),conf);

            Writable value = (Writable)ReflectionUtils.newInstance(reader.getValueClass(),conf);

            long position = reader.getPosition();

            while (reader.next(key,value)){

                String syncSeen = reader.syncSeen() ? "*":"";//同步位显示为*号

                System.out.printf("[%s%s]\t%s\t%s\n",position,syncSeen,key,value);

                position = reader.getPosition();

            }

        }finally {

            IOUtils.closeStream(reader);

        }

    }

hadoop SequenceFile示例的更多相关文章

Hadoop SequenceFile数据结构介绍及读写
在一些应用中,我们需要一种特殊的数据结构来存储数据,并进行读取,这里就分析下为什么用SequenceFile格式文件. Hadoop SequenceFile Hadoop提供的SequenceFil ...
基于Hadoop Sequencefile的小文件解决方案
一.概述小文件是指文件size小于HDFS上block大小的文件.这样的文件会给hadoop的扩展性和性能带来严重问题.首先,在HDFS中,任何block,文件或者目录在内存中均以对象的形式存储,每 ...
<Hadoop><SequenceFile><Hadoop小文件>
Origin 我们首先理解一下SequenceFile试图解决什么问题,然后看SeqFile怎么解决这些问题. In HDFS 序列文件是解决Hadoop小文件问题的一个方法: 小文件是显著小于HDF ...
Hadoop SequenceFile
SequenceFile格式: 每一个SequenceFile都包含一个“头”(header).Header包含了以下几部分. 1.SEQ三个字母的byte数组 2.Version number的by ...
运行Hadoop的示例程序WordCount-Running Hadoop Example
In the last post we've installed Hadoop 2.2.0 on Ubuntu. Now we'll see how to launch an example ma ...
hadoop FileSystem类和SequenceFile类实例
Hadoop的FileSystem类是与Hadoop的某一文件系统进行交互的API,虽然我们主要聚焦于HDFS实例,但还是应该集成FileSystem抽象类,并编写代码,使其在不同的文件系统中可移植, ...
Hadoop 写SequenceFile文件源代码
package com.tdxx.hadoop.sequencefile; import java.io.IOException; import org.apache.hadoop.conf.Conf ...
Hadoop Map/Reduce 示例程序WordCount
#进入hadoop安装目录 cd /usr/local/hadoop #创建示例文件:input #在里面输入以下内容: #Hello world, Bye world! vim input #在hd ...
Hadoop小文件存储方案
原文地址:https://www.cnblogs.com/ballwql/p/8944025.html HDFS总体架构在介绍文件存储方案之前,我觉得有必要先介绍下关于HDFS存储架构方面的一些知识 ...

随机推荐

C#学习第一阶段——语法基础
C#是一门面向对象的编程语言.在面向对象的程序设计方法中,程序由各种相互交互的对象组成.相同种类的对象具有相同的属性,或者说是在相同的class 中的. 例如,以矩形为例,它具有高(len ...
H5-基础-day01
类选择器和ID选择器相同点:可以应用于任何元素不同点: 1.ID选择器只能在文档中使用一次.与类选择器不同,在一个HTML文档中,ID选择器只能使用一次,而且仅一次.而类选择器可以使用多次. 2 ...
lesson 23 one man's meat is another man's poison
lesson 23 one man's meat is another man's poison delicacy n. 美味:佳肴: delicious adj. 美味的:可口的关于虚拟语气: I ...
django 与 flask里面从已有数据库表中反向生成models
django: 配置好数据库连接 python manage.py inspectdb > models.py 即可反向生成orm使用的models, 注意: > 后面可以定义为指定路 ...
UVa 1585 - Score - ACM/ICPC Seoul 2005 解题报告 - C语言
1.题目大意给出一个由O和X组成的字符串(长度为80以内),每个O的得分为目前连续出现的O的数量,X得分为0,统计得分. 2.思路实在说不出了,这题没过脑AC的.直接贴代码吧.=_= 3.代码 # ...
QT打开文件路径中含有中文和空格问题
使用qt-mingw版做的软件,发给客户以后说工作不正常,配置文件无法打开,或者加载数据文件不正常.远程查看以后,发现客户经常将程序放置在中文带空格的路径下,导致文件打开不正常.所以最近想在程序上解决 ...
Linux 150命令之文件和目录操作命令 ls
文件和目录操作命令 ls 查看文件和目录查看显示详信息 ls 工具的参数 ls -l 查看文件详细信息 ls -h 查看文件的大小 ls -ld 只查看目录信息 ls –F 给不同文件加上不同标记 l ...
关于set和get机制的整理
首先这是es5新增的:定义是设置和获取对象属性时候出发的方法,属于修饰器: 犀牛书例子: function test(n){ return { get count(){ return n }, set ...
C语言--链表基础模板
1.建立结构体 struct ST { int num;///学号 int score;///成绩 struct ST*next; };///结构体 2.空链表的创建 struct ST creatN ...
windows编程常见数据类型
windows编程常见数据类型, 总结一下方便查阅: 类型对应指针描述 ATOM . typedef WORD ATOM; BOOL LPBOOL 布尔类型,值要写成TRUE或FALSE,实际上是 ...

hadoop SequenceFile示例

hadoop SequenceFile示例的更多相关文章

随机推荐

热门专题