[Hive_add_10] Hive 的 serde (序列化 & 反序列化) 操作

0. 说明

　　serde 是序列化和反序列化 serialize & deserialize

　　是将文件中的字段映射成 Hive 中的列

1. 验证

　　1.1 openCSVSerde

　　CSV 为逗号分隔的文件

create table serde_csv (id int, name string , age int)

row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'

stored as textfile;

create table serde_csv2 (id int, name string , age int)

row format delimited

fields terminated by ','

stored as textfile;

　　1.2 jsonSerde

　　将 json 数据映射成列数据

　　1. 准备 1.json 和 json-serde

　　2. 部署 json-serde
　　将 json-serde-1.3.8-jar-with-dependencies.jar 放置在 /soft/hive/lib 下并重启 Hive

　　3. 创建表并指定表 serde 　　//以反引号作为解析字段``

create table json(`_location` string,`_ip` string,`_action` string, `_uid` string, `_timestamp` string)

ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'

stored as textfile;

　　4. 加载数据

load data local inpath '/home/centos/files/1.json' into table json;

　　5. 查询验证

select * from json;

[Hive_add_10] Hive 的 serde (序列化 & 反序列化) 操作的更多相关文章

php json与xml序列化/反序列化
在web开发中对象的序列化与反序列化经常使用,比较主流的有json格式与xml格式的序列化与反序列化,今天想写个jsop的小demo,结果发现不会使用php序列化,查了一下资料,做个笔记简单数组js ...
基于.net core封装的xml序列化，反序列化操作
需求: 由于在.net core中去除了Xml序列化XmlSerializer操作类.因此,在于一此数据传输当中出,需要用到对xml格式字符串的处理问题.因此封装了一个xml序列化与反序列化操作的类库 ...
python json序列化与反序列化操作
python json序列化与反序列化操作 # dumps() dict-->str 序列化 # loads() str---dict 反序列化 result1 = json.dumps({'a ...
java浅克隆和深克隆，序列化和反序列化实现深克隆（封装序列化和反序列化操作）
本篇博客内容: 一.浅克隆(ShallowClone)和深克隆(DeepClone) 二.序列化和反序列化实现深克隆三.封装序列化和反序列化操作 ObjectOutputStream + 内存流By ...
DRF框架之Serializer序列化器的反序列化操作
昨天,我们完成了Serializer序列化器的反序列化操作,那么今天我们就来学习Serializer序列化器的最后一点知识,反序列化操作. 首先,我们定要明确什么是反序列化操作? 反序列化操作:JOS ...
Hive数据类型和DDL操作
hive命令在Linux下的命令行中直接输入如下命令,可以查看帮助信息: # hive -help 常用的如-e.-f参数. 使用-e参数,可以直接在命令行传递SQL语句进行hive表数据的查询: ...
Hive的基本知识与操作
Hive的基本知识与操作目录 Hive的基本知识与操作 Hive的基本概念为什么使用Hive? Hive的特点: Hive的优缺点: Hive应用场景 Hive架构 Client Metastor ...
hive元数据库表分析及操作
在安装Hive时,需要在hive-site.xml文件中配置元数据相关信息.与传统关系型数据库不同的是,hive表中的数据都是保存的HDFS上,也就是说hive中的数据库.表.分区等都可以在HDFS找 ...
pickle 序列化反序列化
python的pickle模块实现了基本的数据序列和反序列化.通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储:通过pickle模块的反序列化操作,我们能够从文件 ...

随机推荐

for循环中let与var的区别，块级作用域如何产生与迭代中变量i如何记忆上一步的猜想
我在前一篇讨论let与var区别的博客中,顺带一笔带过了let与var在for循环中的不同表现,虽然解释了是块级作用域的影响,但具体是怎么去影响的呢,我尝试的去理解了下,这篇博客主要从for循环步骤拆 ...
MySQL及其图形界面navicat的安装
数据库的第一步就是安装MySQL了,基本的安装方法都在这里,所以这里小编整理出来,一方面为了自己复习,一方面也方便大家. (关于MySQL的笔试题,具体见下面博客:http://www.cnblogs ...
Yaml 文件中Condition If- else 判断的问题
在做项目的CI/ CD 时,难免会用到 Travis.CI 和 AppVeyor 以及 CodeCov 来判断测试的覆盖率,今天突然遇到了一个问题,就是我需要在每次做测试的时候判断是否存在一个环境变量 ...
Perl包相关
名称冲突问题假如在sum2.pm中使用require导入了一个代码文件sum1.pm: #!/usr/bin/env perl use strict; use warnings; use 5.010 ...
分布式系统监视zabbix讲解九之使用snmp监控windows--技术流ken
前言使用zabbix监控windows主要有两种方法,一种是在windows端安装zabbix-agent客户端工具,安装麻烦.另外一种是使用snmp协议,配置简单快捷.两种配置都可以实现同样的效果 ...
[转]php中 curl模拟post发送json并接收json
本文转自:https://blog.csdn.net/pangchengyong0724/article/details/52103962 本地模拟请求服务器数据,请求数据格式为json,服务器返回数 ...
C# 使用 PerformanceCounter 获取 CPU 和硬盘的使用率
C# 使用 PerformanceCounter 获取 CPU 和硬盘的使用率: 先看界面: 建一个 Windows Form 桌面程序,代码如下: using System; using Sys ...
[android] 帧布局
/*******************2016年5月3日更新**************************************/ 知乎:如何理解andriod中的View和framela ...
如何让gitbook与github仓库关联
一.账号注册分别https://legacy.gitbook.com/login和https://github.com/注册账号. https://legacy.gitbook.com/login登 ...
Ext中defaults与fieldDefaults
不同点:defaults :直接子组件中的默认配置fieldDefaults: 后代组件中的默认配置相同点:组件自己的配置中指定的值优先

[Hive_add_10] Hive 的 serde (序列化 & 反序列化) 操作

0. 说明

1. 验证

1.1 openCSVSerde

1.2 jsonSerde

[Hive_add_10] Hive 的 serde (序列化 & 反序列化) 操作的更多相关文章

随机推荐

热门专题

　　1.1 openCSVSerde

　　1.2 jsonSerde