定制Writable类

以IntWritable为例介绍，定制writable的步骤

//继承 WritableComparable接口(继承了writable接口和comparable接口)

public class IntWritable implements WritableComparable<IntWritable> {

//定义普通java类型的成员变量

private int value;

//成员变量的set方法

public void set(int value) { this.value = value; }

//成员变量的get方法

public int get() { return value; }  

//无参构造函数，为MR框架反射机制所调用

public IntWritable() {}

//有参构造函数

public IntWritable(int value) { set(value); }

//反序列化方法

public void readFields(DataInput in) throws IOException {

  value = in.readInt();

}

//序列化方法

public void write(DataOutput out) throws IOException {

  out.writeInt(value);

}

//覆写equals()方法

public boolean equals(Object o) {

  if (!(o instanceof IntWritable))

    return false;

  IntWritable other = (IntWritable)o;

  return this.value == other.value;

}

//覆写hashCode()方法

public int hashCode() {

  return value;

}

//覆写toString()方法

public String toString() {

  return Integer.toString(value);

}

//覆写 comparable接口 中的compareTo()方法【默认升序】

public int compareTo(IntWritable o) {

  int thisValue = this.value;

  int thatValue = o.value;

  return (thisValue<thatValue ? - : (thisValue==thatValue ?  : ));

}

  //1. 定义内部类Comparator【比较器】继承自WritableComparator类

public static class Comparator extends WritableComparator {

  //2. 不可缺少的无参构造函数，反射机制调用

  public Comparator() {

    super(IntWritable.class);

  }

  //3. 覆写 字节流层面的比较排序

  public int compare(byte[] b1, int s1, int l1,

                     byte[] b2, int s2, int l2) {

    //返回 字符数组b1 的编码值

    int thisValue = readInt(b1, s1);

    int thatValue = readInt(b2, s2);

    return (thisValue<thatValue ? - : (thisValue==thatValue ?  : ));

  }

}

//4. 向WritableComparator类注册定制的writable类【Haoop自动调用上述的比较器】

static {

  WritableComparator.define(IntWritable.class, new Comparator());

}

}

注意点：

在定制Writable类中实现字节流层面的比较时，一般不直接继承RawComparator类，而是继承其子类WritableComparator，因为子类为我们提供了一些有用的工具方法，比如从字节数组中读取int、long和vlong等值。并覆写 public int compare(byte[] b1, int s1, int l1, byte[] b2, int s2, int l2) 方法。
当然编写完compare()方法之后，不要忘了为定制的Writable类注册编写的RawComparator类。
对于代码中的 readInt()工具方法的具体实现：

/** Parse an integer from a byte array. */

  public static int readInt(byte[] bytes, int start) {

    return (((bytes[start  ] & 0xff) << ) +

            ((bytes[start+] & 0xff) << ) +

            ((bytes[start+] & 0xff) <<  ) +

            ((bytes[start+] & 0xff)));

  }

定制Writable类的更多相关文章

hadoop中实现定制Writable类
Hadoop中有一套Writable实现可以满足大部分需求,但是在有些情况下,我们需要根据自己的需要构造一个新的实现,有了定制的Writable,我们就可以完全控制二进制表示和排序顺序. 为了演示如何 ...
Hadoop中Writable类之四
1.定制Writable类型 Hadoop中有一套Writable实现,例如:IntWritable.Text等,但是,有时候可能并不能满足自己的需求,这个时候,就需要自己定制Writable类型. ...
Java Gradle入门指南之内建与定制任务类（buildSrc、Groovy等）
上一篇随笔介绍了Gradle的安装与任务管理,这篇着重介绍Gradle的内建任务(in-built tasks)与自定义任务(custom tasks),借助Gradle提供的众多内建任务类型 ...
python 元类与定制元类
1:元类元类:类的创建与管理者所有类的元类是type class a: pass print(type(a)) 结果:<class 'type'> 2:定制元类类的实例化过程:(可看 ...
Hadoop中Writable类之二
1.ASCII.Unicode.UFT-8 在看Text类型的时候,里面出现了上面三种编码,先看看这三种编码: ASCII是基于拉丁字母的一套电脑编码系统.它主要用于显示现代英语和其他西欧语言.它是现 ...
hadoop中典型Writable类详解
本文地址:http://www.cnblogs.com/archimedes/p/hadoop-writable.html,转载请注明源地址. Hadoop将很多Writable类归入org.apac ...
hadoop中的序列化与Writable类
本文地址:http://www.cnblogs.com/archimedes/p/hadoop-writable-class.html,转载请注明源地址. hadoop中自带的org.apache.h ...
Hadoop中Writable类
1.Writable简单介绍在前面的博客中,经常出现IntWritable,ByteWritable.....光从字面上,就可以看出,给人的感觉是基本数据类型和序列化!在Hadoop中自带的or ...
Hadoop中Writable类之三
1.BytesWritable <1>定义 ByteWritable是对二进制数据组的封装.它的序列化格式为一个用于指定后面数据字节数的整数域(4个字节),后跟字节本身. 举个例子,假如有 ...

随机推荐

Java调用http保留访问状态
package com.coracle; import com.coracle.yk.xframework.util.yunTongXun.HttpRequest; import java.io.*; ...
Ubuntu安装atom
sudo add-apt-repository ppa:webupd8team/atom sudo apt-get update sudo apt-get install atom 安装的时如果报错, ...
启动原生Hadoop集群或伪分布环境
一:启动Hadoop 集群或伪分布安装成功之后,通过执行./sbin/start-all.sh启动Hadoop环境通过jps命令查看当前启动进程是否正确~ [root@neusoft-master ...
2017 Multi-University Training Contest - Team 6—HDU6098&&HDU6106&&HDU6103
HDU6098 Inversion 题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6098 题目意思:题目很短,给出一个数组,下标从1开始,现在输出一个 ...
清除webkit浏览器css设置滚动条
主要有下面7个属性 ::-webkit-scrollbar 滚动条整体部分,可以设置宽度啥的 ::-webkit-scrollbar-button 滚动条两端的按钮 ::-webkit-scrollb ...
angular(一)
angularjs第一章•angluarjs介绍·什么是angularjs•AngularJS 是一个为动态WEB应用设计的结构框架,提供给大家一种新的开发应用方式,这种方式可以让你扩展HTML的语法 ...
super()函数的用法
http://www.runoob.com/python/python-func-super.html class FooParent(object): def __init__(self): sel ...
OnePy--构建属于自己的量化回测框架
本文主要记录我构建量化回测系统的学习历程. 被遗弃的项目:Chandlercjy/OnePy_Old 新更新中的项目:Chandlercjy/OnePy 目录 1. 那究竟应该学习哪种编程语言比较好呢 ...
Solr 整合
1. Solr 与 Lucene 的区别 Lucene是一个开发源代码的全文检索引擎工具包,它不是一个完整的全文检索引擎,Lucene 提供了完整的查询引擎和索引引擎,目的是为软件开发人员提供一个简 ...
neutron ml2
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/zhoumingbo532/article/details/27964675 在介绍ml2之前,先介绍 ...

定制Writable类

定制Writable类的更多相关文章

随机推荐

热门专题