定义DoubleArray并将其作为value写入SequenceFile

1)上代码：

 /**

  * Created with IntelliJ IDEA.

  * User: hadoop

  * Date: 16-1-20

  * Time: 下午7:30

  * To change this template use File | Settings | File Templates.

  */

 import org.apache.hadoop.io.*;

 import java.util.*;

 public class DoubleWritableArray {

     public static class DoubleArray extends ArrayWritable{

       public DoubleArray(){

           super(DoubleWritable.class);

       }

        // public  DoubleWritable[] get(){return values;}

        public static double[] convert2double(DoubleWritable[] w){

             double[] value=new double[w.length];

             for (int i = 0; i < value.length; i++) {

                 value[i]=Double.valueOf(w[i].get());

             }

             return value;

         }

     }

     public static void main(String[]args){

         ArrayWritable aw=new ArrayWritable(DoubleWritable.class);

         aw.set(new DoubleWritable[] {new DoubleWritable(4.34),new DoubleWritable(6.56),

                 new DoubleWritable(9.56)});

         DoubleWritable[] values=(DoubleWritable[])aw.get();

         for(DoubleWritable val1:values){

             System.out.println(val1);

         }

         //与ArrayWritable相比，新定义的DoubleArray只是在调用构造函数的时候少写了DoubleWritable类而已

         DoubleArray d=new DoubleArray();

         d.set(new DoubleWritable[] {new DoubleWritable(4.34),new DoubleWritable(6.56),

                 new DoubleWritable(9.56)});

         double[] temp=DoubleArray.convert2double((DoubleWritable[])d.get())   ;

         for (double val:temp)

             System.out.println(val);

     }

 }

ArrayWritable作为reduce的输入的话，需要创建其子类，在子类中创建一个无参构造函数。

来源：http://grepcode.com/file/repo1.maven.org/maven2/org.jvnet.hudson.hadoop/hadoop-core/0.19.1-hudson-2/org/apache/hadoop/io/ArrayWritable.java#ArrayWritable.toArray%28%29

2）读取txt文件并将其以<long,DoubleArray>作为键值对的形式写入SequenceFile

 package convert;

 /**

  * Created with IntelliJ IDEA.

  * User: hadoop

  * Date: 16-1-19

  * Time: 下午3:09

  * To change this template use File | Settings | File Templates.

  */

 import java.io.IOException;

 import java.net.URI;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.FileSystem;

 import org.apache.hadoop.fs.Path;

 import org.apache.hadoop.io.DoubleWritable;

 import org.apache.hadoop.io.IOUtils;

 import org.apache.hadoop.io.IntWritable;

 import org.apache.hadoop.io.LongWritable;

 import org.apache.hadoop.io.SequenceFile;

 import org.apache.hadoop.io.Text;

 import org.apache.commons.io.FileUtils;

 import org.apache.commons.io.LineIterator;

 //import Jama.Matrix.*;

 //import  java.io.IOException;

 import java.io.File;

 //import javax.sound.midi.SysexMessage;

 public class SequenceFileWriteDemo {

     public static void main(String[] args) throws IOException {

         String uri ="/home/hadoop/srcData/bDoubleArraySeq";

         Configuration conf = new Configuration();

         FileSystem fs = FileSystem.get(URI.create(uri), conf);

         Path path = new Path(uri);

         LongWritable key = new LongWritable();

         DoubleArrayWritable value = new DoubleArrayWritable();

         SequenceFile.Writer writer = null;

         try {

             writer = SequenceFile.createWriter(fs, conf, path, key.getClass(),

                     value.getClass());

             final LineIterator it2 = FileUtils.lineIterator(new File("/home/hadoop/srcData/transB.txt"), "UTF-8");

             try {

                 int i=0;

                 String[] strings;

                 DoubleWritable[] ArrayDoubleWritables;

                 while (it2.hasNext()) {

                     ++i;

                     final String line = it2.nextLine();

                     key.set(i);

                     strings=line.split("\t");

                     ArrayDoubleWritables=new DoubleWritable[strings.length];

                     for (int j = 0; j < ArrayDoubleWritables.length; j++) {

                         ArrayDoubleWritables[j] =new DoubleWritable(Double.valueOf(strings[j]));

                     }

                     value.set(ArrayDoubleWritables);

                     writer.append(key,value);

                     //System.out.println("ffd");

                 }

             } finally {

                 it2.close();

             }

         }finally {

             IOUtils.closeStream(writer);

         }

         System.out.println("ok");

     }

 }

定义DoubleArray并将其作为value写入SequenceFile的更多相关文章

自定义数据类型写入SequenceFile并读出
开头对这边博客的内容做个概述,首先是定义了一个DoubleArrayWritable的类,用于存放矩阵的列向量,然后将其作为value写入SequenceFile中,key就是对应的矩阵的列号,最后( ...
视频文件写入转换之图像处理-OpenCV应用学习笔记五
在<笔记二>中我们做了视频播放和控制的实现,仅仅算是完成了对视频文件的读取操作:今天我们来一起练习下对视频文件的写入操作:格式转换. 实现功能: 打开一个视频文件play.avi,读取文件 ...
ClickHouse数据库数据定义手记之数据类型
前提前边一篇文章详细分析了如何在Windows10系统下搭建ClickHouse的开发环境,接着需要详细学习一下此数据库的数据定义,包括数据类型.DDL和DML.ClickHouse作为一款完备的D ...
初识python： xlsxwriter 将数据写入Excel
使用 xlsxwriter 模块将数据写入excel . #!/user/bin env python # author:Simple-Sir # time:2020/9/24 12:51 # 使用 ...
Linux shell 脚本中使用 alias 定义的别名
https://www.cnblogs.com/chenjo/p/11145021.html 核心知识点: 用 shopt 开启和关闭 alias 扩展交互模式下alias 扩展默认是开启的,脚本模 ...
MapReduce剖析笔记之八: Map输出数据的处理类MapOutputBuffer分析
在上一节我们分析了Child子进程启动,处理Map.Reduce任务的主要过程,但对于一些细节没有分析,这一节主要对MapOutputBuffer这个关键类进行分析. MapOutputBuffer顾 ...
windows7命令帮助大全
有关某个命令的详细信息,请键入 HELP 命令名ASSOC 显示或修改文件扩展名关联.ATTRIB 显示或更改文件属性.BREAK 设置或清除扩展式 CTRL+C 检查.BCDEDIT 设置启动数据库 ...
MVC系列——MVC源码学习：打造自己的MVC框架（一：核心原理）
前言:最近一段时间在学习MVC源码,说实话,研读源码真是一个痛苦的过程,好多晦涩的语法搞得人晕晕乎乎.这两天算是理解了一小部分,这里先记录下来,也给需要的园友一个参考,奈何博主技术有限,如有理解不妥之 ...
Android中基于CGroup的memory子系统HAL层分析-lmkd
Android在内存管理上于Linux有些小的区别,其中一个就是引入了lowmemorykiller.从lowmemorykiller.c位于drivers/staging/android也可知道,属 ...

随机推荐

eclipse集成mybatis的generater插件
mybatis也能方向生成代码,能方向生成实体类(po).mapper接口和Mapper接口映射文件,能减少我们代码的工作量.详细步骤如下 1.下载mybatis生成架包工具MyBatis_Gener ...
region xx not deployed on any region server
ERROR: Region { meta => month_hotstatic,860010-2288000000_201405_5_exit_00000047486,1400144486405 ...
Spring学习--xml 中 Bean 的自动装配
Spring IOC 容器可以自动装配 Bean. 只要在 <bean> 的 autowire 属性里指定自动装配的模式. byName(根据名称自动装配):必须将目标 Bean 的名称和 ...
校内训练0609 problem c
[题目大意] 给一棵树,求有多少条路径满足总和-最大值是P的倍数 n<=10^5, P<=10^7 [题解] 一看就是点分治嘛不考虑子树合并,考虑poj1741的做法,每次考虑经过重心 ...
[BZOJ2190&BZOJ2705]欧拉函数应用两例
欧拉函数phi[n]是表示1~n中与n互质的数个数. 可以用公式phi[n]=n*(1-1/p1)*(1-1/p2)*(1-1/p3)...*(1-1/pk)来表示.(p为n的质因子) 求phi[p] ...
bzoj 1876 高精
首先我们知道,对于两个数a,b,他们的gcd情况有如下形式的讨论当a为奇数,b为偶数的时候gcd(a,b)=gcd(a div 2,b) 当b为奇数,a为偶数的时候gcd(a,b)=gcd(a,b ...
hdu 1399 Starship Hakodate-maru （暴力搜索）
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1399 题目大意:找到满足i*i*i+j*(j+1)*(j+2)/6形式且小于等于n的最大值. #inc ...
使用libssh2库实现支持密码参数的ssh2客户端
使用libssh2库实现支持密码参数的ssh2客户端 http://blog.chinaunix.net/uid-24382173-id-229823.html libssh2的简单应用 http:/ ...
该配置节不能包含 CDATA 或文本元素
当执行程序时报“该配置节不能包含 CDATA 或文本元素” ,有可能是你的web.config中有异常的文本节点,比如
Oracle基础 07 参数文件 pfile/spfile
--查看数据库运行模式(spfile还是pfile)select decode(count(*),1,'spfile','pfile') from v$spparameterwhere rownum= ...

定义DoubleArray并将其作为value写入SequenceFile

定义DoubleArray并将其作为value写入SequenceFile的更多相关文章

随机推荐

热门专题