详说大数据计算的可类化Classable

可类化(Classable)是Laxcus大数据管理系统提供的一项基础功能，它能够将类转化为一串字节数组，或者逆向将字节数组转化为一个类。这项功能与JAVA提供的序列化(Serializable)非常相似，但是不同之处在于，可类化是可以由用户自己定义的，包括数据的选择、数据的样式、数据结构等一系列的规则。

        这样的好处在于，我们摆脱了JAVA序列化的那种由系统硬性规定的固定格式，可以自由组织我们需要的数据，包括一些可能是私密的数据；不便在于，因为这种自由，程序员需要做些牺牲，编写代码来实现这项技术。

        尽管这样，Laxcus大数据管理系统已经将这项工作做至极简。API中提供了可类化接口，用户需要做的，是在自己的类中继承这个接口，接口只有两个方法：

<1> int build(ClassWriter writer);

<2> int resolve(ClassReader reader);

        第一个方法是将类输出到可类化写入器(ClassWriter)中，写入器能够写入目前已知的所有格式的数据。

        第二个方法是对写入操作的反向动作，把数据从可类化读取器(ClassReader)还原到类里。

        设计可类化的初衷是因为，在之前的Laxcus大数据集群里，负责组织实施大数据计算的中间件计算组件，采用了JAVA系统默认的序列化来产生数据。序列化产生数据量非常庞大，对网络通信、网络计算、数据存储都造成了巨大的担负。更关键的问题是，在序列化的数据里面，有很多数据是计算过程中并不需要的，它们成为大数据计算的数据“鸡肋”。

        目前的Laxcus中间件计算组件，经过可类化改造后，在Laxcus大数据集群里传输的数据量明显减少，普遍减少量在4-5倍左右，个别已经超过10倍。数据在网络中的传输速度，以及计算机对数据的处理反应能力也得到明显的提高。

        可类化对提升大数据能力非常有效。

详说大数据计算的可类化Classable的更多相关文章

大数据计算框架Hadoop, Spark和MPI
转自:https://www.cnblogs.com/reed/p/7730338.html 今天做题,其中一道是请简要描述一下Hadoop, Spark, MPI三种计算框架的特点以及分别适用于什 ...
MepReduce-开启大数据计算之门
Hadoop MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算.早期的MapReduce(MR)框架简单明了,JobTracker作为MR框架的集中处理点,随着分布式系统集群 ...
什么是大数据计算服务MaxCompute
大数据计算服务(MaxCompute,原名ODPS)是一种快速.完全托管的EB级数据仓库解决方案. 当今社会数据收集手段不断丰富,行业数据大量积累,数据规模已增长到了传统软件行业无法承载的海量数据(百 ...
大数据计算引擎之Flink Flink CEP复杂事件编程
原文地址: 大数据计算引擎之Flink Flink CEP复杂事件编程复杂事件编程(CEP)是一种基于流处理的技术,将系统数据看作不同类型的事件,通过分析事件之间的关系,建立不同的时事件系序列库,并 ...
大数据计算的基石——MapReduce
MapReduce Google File System提供了大数据存储的方案,这也为后来HDFS提供了理论依据,但是在大数据存储之上的大数据计算则不得不提到MapReduce. 虽然现在通过框架的不 ...
大数据计算平台Spark内核解读
1.Spark介绍 Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目.随着 Spark在大数据计算领域的暂露头角,越来越多 ...
大数据计算：如何仅用1.5KB内存为十亿对象计数
大数据计算:如何仅用1.5KB内存为十亿对象计数 Big Data Counting: How To Count A Billion Distinct Objects Using Only 1.5K ...
流式大数据计算实践（1）----Hadoop单机模式
一.前言 1.从今天开始进行流式大数据计算的实践之路,需要完成一个车辆实时热力图 2.技术选型:HBase作为数据仓库,Storm作为流式计算框架,ECharts作为热力图的展示 3.计划使用两台虚拟 ...
大数据计算平台Spark内核全面解读
1.Spark介绍 Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目.随着Spark在大数据计算领域的暂露头角,越来越多的 ...

随机推荐

java随机数Reandom(简单介绍)
简单介绍 Java中存在着两种Random函数一.java.lang.Math.Random; 调用这个Math.Random()函数能够返回带正号的double值,该值大于等于0.0且小于1.0, ...
Css 截取字符串长度
.shortNameShow{ overflow:hidden; text-overflow:ellipsis; -o-text-overflow:ellipsis; white-space:nowr ...
调用URL 接口服务
1.Net调用URL 接口服务 using System; using System.Collections; using System.Configuration; using System.Dat ...
HDU1215 七夕节（模拟数学）
传送门: http://acm.hdu.edu.cn/showproblem.php?pid=1215 七夕节 Time Limit: 2000/1000 MS (Java/Others) Me ...
使用终端命令行将本地项目上传到Github并提交代码
第一步: 在Github上创建自己的repository 第二步:建立本地仓库cd到你的本地项目根目录下,执行git命令 1:$ cd 到你的项目目录下 2:$ git init 第三步:将本地项目工 ...
java面向对象编程思想的理解
1.我们总说java是一门面向对象编程的语言,那什么是面向对象呢? 我是这样理解的,对象是事物存在的实体,如,猪.狗,花早等都是对象,对象由两部分组成.面向对象编程的三大特点:继承,多态,类是封装对象 ...
git使用简介（一）
附上廖雪峰老师Git教程https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000 创建版本 ...
于是他错误的点名开始了（trie树）
题目背景 XS中学化学竞赛组教练是一个酷爱炉石的人. 他会一边搓炉石一边点名以至于有一天他连续点到了某个同学两次,然后正好被路过的校长发现了然后就是一顿欧拉欧拉欧拉(详情请见已结束比赛CON900). ...
搭建简单的hadoop集群（译文)
本文翻译翻译自http://hadoop.apache.org/docs/r2.8.0/hadoop-project-dist/hadoop-common/ClusterSetup.html 具体的实 ...
利用nginx使ftp可以通过http访问
./nginx 启动服务./nginx -s stop 关闭服务./nginx -s reload 重新加载配置文件搭建nginx映射ftp服务:打开nginx的配置文件nginx.conf(位于n ...

详说大数据计算的可类化Classable

详说大数据计算的可类化Classable的更多相关文章

随机推荐

热门专题