1、什么是序列化和系列化DE-

神马是序列化它，序列化是内存中的对象状态信息，兑换字节序列以便于存储（持久化）和网络传输。（网络传输和硬盘持久化，你没有一定的手段来进行辨别这些字节序列是什么东西，有什么信息，这些字节序列就是垃圾）。

反序列化就是将收到字节序列或者是硬盘的持久化数据。转换成内存中的对象。

2、JDK的序列化

JDK的序列化仅仅有实现了serializable接口就能实现序列化与反序列化，可是记得一定要加上序列化版本号ID serialVersionUID

这个是识别序列化的之前那个类的究竟是哪一个？我们显示这个序列化版本号ID的目的就是为了：

1）在某些场合，希望类的不同版本号对序列化兼容。因此须要确保类的不同版本号具有同样的serialVersionUID；

2）在某些场合，不希望类的不同版本号对序列化兼容。因此须要确保类的不同版本号具有不同的serialVersionUID。

java的序列化算法要考虑到以下这些东西：

◆将对象实例相关的类元数据输出。

◆递归地输出类的超类描写叙述直到不再有超类。

◆类元数据完了以后。開始从最顶层的超类開始输出对象实例的实际数据值。

◆从上至下递归输出实例的数据

所以java的序列化确实非常强大，序列化后得到的信息也非常具体。所以反序列化就so easy.

可是这样做也有它的坏处，序列化后非常占内存，所以不一定具体就是优点。简单有时也是不错的。

在hadoop中，hadoop实现了一套自己的序列化框架。hadoop的序列化相对于JDK的序列化来说是比較简洁的。在集群中信息的传递主要就是靠这些序列化的字节序列来传递的所以更高速度更小的容量就变得很地重要了。

说了太多的废话。还是扯回JDK的序列化吧。以下我们看一下在JDK中式怎样实现序列化的。

首先我们有一个须要序列化的类例如以下（必须实现serializable接口）

import java.io.Serializable;

public class Block implements Serializable{

	/**

	 *

	 */

	private static final long serialVersionUID = 1L;

	private int id;

	private String name;

	public int getId() {

		return id;

	}

	public void setId(int id) {

		this.id = id;

	}

	public String getName() {

		return name;

	}

	public void setName(String name) {

		this.name = name;

	}

	public Block(int id, String name) {

		this.id = id;

		this.name = name;

	}

}

以下我们来測试一下序列化的结果：

import java.io.ByteArrayInputStream;

import java.io.ByteArrayOutputStream;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.ObjectInputStream;

import java.io.ObjectOutputStream;

public class TestSerializable {

	public static void main(String[] args) throws IOException,

			ClassNotFoundException {

		//将序列化化的数据写到文件out里面（持久化）

		FileOutputStream fos = new FileOutputStream("./out");

		ObjectOutputStream oos = new ObjectOutputStream(fos);

		for (int i = 0; i < 100; i++) {

			Block b = new Block(i, "B"+i);

			oos.writeObject(b);

		}

		oos.flush();

		oos.close();

		//读出一个序列化的对象的字节序列（^..^）就是反序列化

		FileInputStream fis = new FileInputStream("./out");

		ObjectInputStream ois = new ObjectInputStream(fis);

		Block b2 = (Block) ois.readObject();

		ois.close();

		System.out.println(b2.getName());

	}

}

測试的结果：（取出第一个对象的name）

B0

生成一百个对象的持久化数据的大小是：1.60 KB (1,643 字节)一个对象平均16个字节,该类仅仅有两个字段一个是int,一个字符串可是字符串的长度为2，所以我们能够感受到这冗余还是挺大的。

3、hadoop的序列化

hadoop的序列化的特点是：

1、紧凑：因为带宽是集群中信息传递的最宝贵的资源所以我们必须想法设法缩小传递信息的大小，hadoop的序列化就为了更好地坐到这一点而设计的。

2、对象可重用：JDK的反序列化会不断地创建对象，这肯定会造成一定的系统开销。可是在hadoop的反序列化中。能反复的利用一个对象的readField方法来又一次产生不同的对象。

3、可扩展性：当前hadoop的序列化有多中选择

*能够利用实现hadoop的Writable接口。

*使用开源的序列化框架protocol Buffers，Avro等框架。

我们能够注意到的是hadoop2.X之后是实现一个叫YARN的云操作系统。全部应用（如mapreduce。或者其它spark实时或者离线的计算框架都能够执行在YARN上）。YARN还负责对资源的调度等等。

YARN的序列化就是用Google开发的序列化框架protocol Buffers。proto眼下支持支持三种语言C++，java，Python所以RPC这一层我们就能够利用其它语言来做文章，满足其它语言开发人员的需求。

我屮艸芔茻，扯得有点远。

回到hadoop原生的序列化。hadoop原生的序列化类须要实现一个叫Writeable的接口。类似于serializable接口。

还有hadoop也为我们提供了几个序列化类，他们都直接或者间接地实现了Writable接口。如：IntWritable。LongWritable，Text等等。

实现Writable接口必须实现两个方法：write(DataOutputStream out);readField(DataInputStream in)方法。

以下是一个hadoop的序列化样例：

package hadoop;

import java.io.ByteArrayOutputStream;

import java.io.DataInput;

import java.io.DataInputStream;

import java.io.DataOutput;

import java.io.DataOutputStream;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.io.Writable;

import org.junit.Test;

public class Testhadoop_serializable_writable {

	@Test

	public void serializable() throws IOException {

		ByteArrayOutputStream out = new ByteArrayOutputStream();

		DataOutputStream dataOut = new DataOutputStream(out);

		FileOutputStream fos = new FileOutputStream("./hadoop_out");

		for (int i = 0; i < 10; i++) {

			Text t1 = new Text(String.valueOf(i));

			Text t2 = new Text("mw");

			MyWritable mw = new MyWritable(t1,t2);

			mw.write(dataOut);

		}

		dataOut.close();

		fos.write(out.toByteArray());

		fos.flush();

		fos.close();

		FileInputStream fis = new FileInputStream("./hadoop_out");

		DataInputStream dis = new DataInputStream(fis);

		for (int i = 0; i < 10; i++) {

			MyWritable mw = new MyWritable(new Text(), new Text());

			mw.readFields(dis);

			System.out.println(mw.getId() + " " + mw.getName());

		}

	}

}

class MyWritable implements Writable {

	private Text id;

	private Text name;

	public MyWritable(Text id, Text name) {

		super();

		this.id = id;

		this.name = name;

	}

	public synchronized Text getId() {

		return id;

	}

	public synchronized void setId(Text id) {

		this.id = id;

	}

	public synchronized Text getName() {

		return name;

	}

	public synchronized void setName(Text name) {

		this.name = name;

	}

	@Override

	public void write(DataOutput out) throws IOException {

		id.write(out);

		name.write(out);

	}

	@Override

	public void readFields(DataInput in) throws IOException {

		id.readFields(in);

		name.readFields(in);

	}

}

我们能够看到我们实现的自己序列化类MyWritable。他有两个字段都是Text，Text是hadoop自带的序列化类，能够看做字符串（类似吧）吧？！

write()和readField()用到的是回调函数，将流（DataOutputStream DataInputStream）写出。或者读出，都是用到回调函数（hook(钩子)）。

上面的执行结果例如以下：

生成的字节序列：

命令行结果：

完！

java序列化是什么和反序列化和hadoop序列化的更多相关文章

hadoop序列化机制与java序列化机制对比
1.采用的方法: java序列化机制采用的ObjectOutputStream 对象上调用writeObject() 方法: Hadoop 序列化机制调用对象的write() 方法,带一个DataOu ...
Hadoop序列化与Java序列化
序列化就是把内存中的对象的状态信息转换成字节序列,以便于存储(持久化)和网络传输反序列化就是就将收到的字节序列或者是硬盘的持久化数据,转换成内存中的对象. 1.JDK的序列化只要实现了serial ...
Hadoop序列化和反序列化
1. 序列化从头说在面向对象程序设计中,类是个很重要的概念.所谓“类”,可以将它想像成建筑图纸,而对象就是根据图纸盖的大楼.类,规定了对象的一切.根据建筑图纸造房子,盖出来的就是大楼,等同于将 ...
Hadoop Serialization hadoop序列化详解(最新版) (1)【java和hadoop序列化比较和writable接口】
初学java的人肯定对java序列化记忆犹新.最开始很多人并不会一下子理解序列化的意义所在.这样子是因为很多人还是对java最底层的特性不是特别理解,当你经验丰富,对java理解更加深刻之后,你就会发 ...
Java序列化的作用和反序列化
1.序列化是干什么的? 简单说就是为了保存在内存中的各种对象的状态(也就是实例变量,不是方法),并且可以把保存的对象状态再读出来.虽然你可以用你自己的各种各样的方法来保存object states,但 ...
第12讲-Java中的IO操作及对象的序列化与反序列化
1.知识点 1.1.课程回顾 1.2.本章重点 1.2.1 io操作 1.2.2 对象的序列化与反序列化 2.具体内容 2.1.Java IO 2.1.1.什么是IO IO其实就是输入.输出 I ...
【Java面试】简单说一下你对序列化和反序列化的理解
Hi,大家好,我是Mic 一个工作4年的粉丝,投了很多简历好不容易接到一个互联网公司的面试邀约. 在面试第一轮就被干掉了,原因是对主流互联网技术理解太浅了. 其中就有一个这样的问题:"简单 ...
Hadoop阅读笔记（六）——洞悉Hadoop序列化机制Writable
酒,是个好东西,前提要适量.今天参加了公司的年会,主题就是吃.喝.吹,除了那些天生话唠外,大部分人需要加点酒来作催化剂,让一个平时沉默寡言的码农也能成为一个喷子!在大家推杯换盏之际,难免一些画面浮现脑 ...
Hadoop序列化
遗留问题: Hadoop序列化可以复用对象,是在哪里复用的? 介绍Hadoop序列化机制 Hadoop序列化机制详解 Hadoop序列化的核心 Hadoop序列化的比较接口 ObjectWrita ...

随机推荐

MariaDb数据库管理系统学习（二）使用HeidiSQL数据库图形化界面管理工具
HeidiSQL 是一款用于简单化的 MySQL server和数据库管理的图形化界面.该软件同意你浏览你的数据库,管理表,浏览和编辑记录,管理用户权限等等.此外,你能够从文本文件导入数据,执行 SQ ...
Detours信息泄漏漏洞
v\:* {behavior:url(#default#VML);} o\:* {behavior:url(#default#VML);} w\:* {behavior:url(#default#VM ...
hibernate学习(二)
hibernate 单向一对多映射一.数据表设计数据库名:hibernate5 数据表: ①表名:CUSTOMERS 字段: CUSTOMER_ID CUSTOMER_NAME ②表名:ORDE ...
Iterator 和 Iterable 差别和联系
用Iterator模式实现遍历集合 Iterator模式是用于遍历集合类的标准訪问方法.它能够把訪问逻辑从不同类型的集合类中抽象出来,从而避免向client暴露集合的内部结构. 比如,假设没有使用I ...
Android中canvas.save()和canvas.restore()的使用
自己定义控件时经常遇到重写View的Ondraw()方法,Ondraw()方法经常设计到save()和restore()这两个方法.这两个相互匹配出现的,作用是用来保存画布的状态和取出保存的状态的. ...
开源mp3播放器--madplay 编译和移植简记
madplay是一款开源的mp3播放器. http://madplay.sourcearchive.com/ 下面简单记录一下madplay的编译与移植到ARM开发板上的过程一.编译x86版本的ma ...
M I S 开发与管理
今天是开学的第一天,很意外的一天没课.但是我知道还有很多事情在等待这我,不能懈怠!安排好计划,把重要不紧急的事情逐渐蚕食掉,切不可养虎为患,等拖到它变成重要紧急事件后,那就后悔莫及了. 下午看了看自考 ...
基于CefGlue的桌面应用开发
原文地址:http://johnnyfee.github.io/csharp/2013/12/21/cef-glue/ 前言如果你想使用WEB技术来开发桌面客户端,并且是想使用的语言也是C#时,那请 ...
hdu4487（概率dp）
题目连接:http://acm.hdu.edu.cn/showproblem.php?pid=4487 题意:开始位置在0,每一步可以向右向左或者不动,问走了n步后,路径中能到达最右的期望. 分析:d ...
python手记(46)
#!/usr/bin/env python # -*- coding: utf-8 -*- #http://blog.csdn.net/myhaspl #code:myhaspl@qq.com ...

java序列化是什么和反序列化和hadoop序列化

1、什么是序列化和系列化DE-

2、JDK的序列化

3、hadoop的序列化

java序列化是什么和反序列化和hadoop序列化的更多相关文章

随机推荐

热门专题