Apache Avro总结
类型名
|
描述
|
描述
|
二进制编码(Binary Encoding)
|
排序(Sort Order)
|
null
|
空
|
no value
|
0字节(zero bytes)
|
总是相等
|
boolean
|
布尔值(0或1)
|
a binary value
|
1字节,值是0(false)或者1(true)
|
false在前,true在后
|
int
|
32位有符号整数
|
32-bit signed integer
|
使用可变长度编码(variable-length)、zig-zag编码
|
按数值升序排列
|
long
|
64位有符号整数
|
64-bit signed integer
|
使用可变长度编码(variable-length)、zig-zag编码
|
按数值升序排列
|
float
|
单精度(32位)的IEEE 754浮点数
|
single precision (32-bit) IEEE 754
floating-point number
|
4字节,float浮点数会被转换成32位的整数,
|
按数值升序排列
|
double
|
双精度(64位)的IEEE 754浮点数
|
double precision (64-bit) IEEE 754
floating-point number
|
8字节,double浮点数会被转换成64位的整数,
|
按数值升序排列
|
bytes
|
8位无符号字节序列
|
sequence of 8-bit unsigned bytes
|
编码成long类型,后面跟着很多字节的数据。
|
按字典顺序通过无符号8位值进行比较。
|
string
|
字符串
|
unicode character sequence
|
编码成long类型,后面跟着很多字节的UTF-8编码的字符数据。
|
按字典顺序由Unicode代码点进行比较。由于UTF-8用作字符串的二进制编码,因此字节和字符串二进制数据的排序是相同的。
|
类型名
|
描述
|
样例
|
二进制编码(Binary Encoding)
|
排序(Sort Order)
|
Records
|
记录
|
{
"type": "record",
"name": "LongList",
"aliases": ["LinkedLongs"],
// old name for this
"fields" : [
{"name": "value", "type": "long"},
// each element has a long
{"name": "next", "type": ["null", "LongList"]}
// optional next element
]
}
|
记录通过模式里面声明的字段顺序编码,换句话说,记录被编码成它的字段编码的连接。字段值按它的模式编码。
|
记录数据按字段的字典顺序排序。 如果字段指定其顺序为:
“升序”,然后其值的顺序不变。
“降序”,然后其值的顺序颠倒过来。
“忽略”,然后在排序时忽略其值。
|
Enums
|
枚举
|
{ "type": "enum",
"name": "Suit",
"symbols" : ["SPADES", "HEARTS", "DIAMONDS", "CLUBS"]
}
|
枚举由int编码,表示模式中符号从零开始的位置。
|
按符号在枚举模式中的位置排序
|
Arrays
|
数组
|
{"type": "array", "items": "string"}
|
数组被编码为一系列块(block)。 每个块包含一个长整数的计数,后跟许多数组项。计数为零的块表示数组的结束。每个元素都按照数组的模式进行编码。
|
按字典顺序进行元素比较。
|
Maps
|
映射(字典)
|
{"type": "map", "values": "long"}
|
映射被编码为一系列块(block)。每个块由一个长整数的计数,后跟许多键/值对。计数为零的块表示映射的结束。每个元素都按照映射的模式进行编码。
|
无法比较。
|
Unions
|
联合类型
|
即值可以是类型列表中的一种类型
["null", "string"]表示模式可以是null或者string
|
通过首先写入一个long值来编码union,该值指示其值的模式的并集内的从零开始的位置。 然后根据联合中指示的模式对该值进行编码。
|
union数据首先由union中的分支排序,并且在其中由分支的类型排序。 例如,[“int”,“string”] union将在所有字符串值之前对所有int值进行排序,其中int和字符串本身按上面的定义排序。
|
Fixed
|
固定大小
|
{"type": "fixed", "size": 16, "name": "md5"}
|
使用模式中声明的字节数对固定实例进行编码。
|
按字典顺序通过无符号8位值进行比较。
|
Apache Avro总结的更多相关文章
- java.lang.NoClassDefFoundError: org/apache/avro/ipc/Responder
文章发自:http://www.cnblogs.com/hark0623/p/4170174.html 转发请注明 java.lang.NoClassDefFoundError: org/a ...
- Apache Avro 与 Thrift 比较
http://www.tbdata.org/archives/1307 Avro和Thrift都是跨语言,基于二进制的高性能的通讯中间件. 它们都提供了数据序列化的功能和RPC服务. 总体功能上类似, ...
- Apache Avro# 1.8.2 Specification (Avro 1.8.2规范)二
h5 { text-indent: 0.71cm; margin-top: 0.49cm; margin-bottom: 0.51cm; direction: ltr; color: #000000; ...
- Apache Avro# 1.8.2 Specification (Avro 1.8.2规范)一
h4 { text-indent: 0.71cm; margin-top: 0.49cm; margin-bottom: 0.51cm; direction: ltr; color: #000000; ...
- 异常-CDH的service无法启动并抛出异常-org.apache.avro.AvroRemoteException: java.net.ConnectException: Connection refused (Connection refused)
1 详细异常 org.apache.avro.AvroRemoteException: java.net.ConnectException: Connection refused (Connectio ...
- Hadoop基础-Apache Avro串行化的与反串行化
Hadoop基础-Apache Avro串行化的与反串行化 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Apache Avro简介 1>.Apache Avro的来源 ...
- Apache Avro:一个新的数据交换格式
原文: http://blog.cloudera.com/blog/2009/11/avro-a-new-format-for-data-interchange/ 注:由于个人英语能力有限,翻译不准确 ...
- Hadoop-异常-Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/avro/io/DatumReader
//maven org.apache.avr 下载不完全 ,去maven If you are using maven to build your jar, you need to add the ...
- Apache Avro & Avro Schema简介
为什么需要schema registry? 首先我们知道: Kafka将字节作为输入并发布 没有数据验证 但是: 如果Producer发送了bad data怎么办? 如果字段被重命名怎么办? 如果数据 ...
随机推荐
- linux下oracle调试小知识
1.oracle 安装下的/u01/diag/rdbms/orcl/HOF/incident目录下是什么文件?答:每当一个错误发生的时候,oracle会创建一个incident,并且分配一个INCID ...
- python+selenium爬取百度文库不能下载的word文档
有些时候我们需要用到百度文库的某些文章时,却发现需要会员才能下载,很难受,其实我们可以通过爬虫的方式来获取到我们所需要的文本. 工具:python3.7+selenium+任意一款编辑器 前期准备:可 ...
- Ceph 存储集群2-配置:心跳选项、OSD选项、存储池、归置组和 CRUSH 选项
一.心跳选项 完成基本配置后就可以部署.运行 Ceph 了.执行 ceph health 或 ceph -s 命令时,监视器会报告 Ceph 存储集群的当前状态.监视器通过让各 OSD 自己报告.并接 ...
- Notepad++ Plugin Manager更新插件出错
作为墙内人士,更新个插件都TMD浪费很长时间! 解决方案: 定位文件notepaid++\updater\GUP.exe What is WinGup? --------------- WinGup ...
- Codeforces 1248C Ivan the Fool and the Probability Theory(推公式)
题意 一个n*m的网格图,每个格子可以染黑色.白色,问你每个格子最多有一个相邻颜色相同的方案数 n,m<=1e5 思路 我们先处理\(1 \times m\)的情况 设\(f[i][j]\)为前 ...
- 手机控制电脑第二弹之HIPC
点击蓝字关注我们 是否很多时候电脑不在身边,又急需要使用,比如正好要用一个文件,又没有放在我们的网盘中,想用手机查看电脑状态,但是很多太复杂的方式不会使用,需要简单的方式,今天方成分享给你 前言 故事 ...
- 基于MySQL+MHA+Haproxy部署高可用负载均衡集群
一.MHA 概述 MHA(Master High Availability)是可以在MySQL上使用的一套高可用方案.所编写的语言为Perl 从名字上我们可以看到.MHA的目的就是为了维护Master ...
- OSPF RFC2740
2.5. Use of link-local addresses IPv6 link-local addresses are for use on a single link, for purpose ...
- Zookeeper 部署 配置文件
Zookeeper的搭建方式 Zookeeper安装方式有三种,单机模式和集群模式以及伪集群模式. ■ 单机模式: Zookeeper只运行在一台服务器上,适合测试环境:■ 伪集群模式:就是 ...
- [CentOS7 mini]Linux命令补全 yum install bash-completion
CentOS7 mini默认不带命令补全需要自行安装 使用国内yum清华源 安装完后退出当前窗口再登录生效 # yum install -y bash-completion 已加载插件:fastest ...