Hive之SerDe&Beeline

2024-11-01 23:45:36 原文

一.SerDe

　　SerDe:Serializer and Deserializer 序列化及反序列化，构建在数据存储和执行引擎之间，对两者实现解耦。

　　Hive通过ROW FORMAT DELIMITED 以及SERDE进行内容的读写。

　　样板：

　　row format

　　:DELIMITED

　　　　[FIELDS TERMIINATED BY char [ESCAPED BY char]

　　　　[COLLECTION ITEMS TERMINATED BY char]

　　　　[MAP KEYS TERMINATED BY char]

　　　　[LINES TERMINATED BY char]

　　:SERDE serde_name [WITH SERDEPROPERTIES (property_name=property_value,property_name=property_value...)]

　　案例1：

　　　　create table zhen(id int, name string,age int)

　　　　row format delimited fields terminated by ',' collection items terninated by ',' map keys terminated by ':' lines terminated by '\n' ;

　　案例2：

　　　　create table zhen(id int, name string,age int)

　　　　row format serde 'org.apache.hadoop.hive.serde2.RegexSerDe' with serdeproperties("input.regex" = "([^ ])([^ ])([^ ])") // 正则匹配

　　　　stored as textfile;

　　备注：lines 默认按照换行拆分！

二.Beeline

　　格式化数据表数据，Beeline要和HiveServer2配合使用。服务端启动hiveserver2，客户端通过beeline两种方式连接hive

　　1.beeline -u jdbc:hive2://localhost:10000/default -n root

　　2.1.beeline

　　2.2 !connect jebc:hive2:/localhost:10000/defalut;auth-noSasl root 123

　

　　

Hive之SerDe&Beeline的更多相关文章

[Hive_add_10] Hive 的 serde (序列化 & 反序列化) 操作
0. 说明 serde 是序列化和反序列化 serialize & deserialize 是将文件中的字段映射成 Hive 中的列 1. 验证 1.1 openCSVSerde CSV 为逗 ...
Hive 学习之路（三）—— Hive CLI和Beeline命令行的基本使用
一.Hive CLI 1.1 Help 使用hive -H或者 hive --help命令可以查看所有命令的帮助,显示如下: usage: hive -d,--define <key=value ...
Hive 系列（三）—— Hive CLI 和 Beeline 命令行的基本使用
一.Hive CLI 1.1 Help 使用 hive -H 或者 hive --help 命令可以查看所有命令的帮助,显示如下: usage: hive -d,--define <key=va ...
java使用JDBC连接hive（使用beeline与hiveserver2）
首先虚拟机上已经安装好hive. 下面是连接hive需要的操作. 一.配置. 1.查找虚拟机的ip 输入 ifconfig 2.配置文件 (1)配置hadoop目录下的core-site.xml和hd ...
Hive beeline update
Hive cli vs beeline The primary difference between the two involves how the clients connect to Hive. ...
beeline 连接hive
HiveServer2是一个能使客户端针对hive执行查询的一种服务,与HiverServer1比较,它能够支持多个客户端的并发请求和授权的:HiveCLI 和 hive –e的方式比较单一,HS2允 ...
Hadoop Hive概念学习系列之hive三种方式区别和搭建、HiveServer2环境搭建、HWI环境搭建和beeline环境搭建（五）
说在前面的话以下三种情况,最好是在3台集群里做,比如,master.slave1.slave2的master和slave1都安装了hive,将master作为服务端,将slave1作为服务端. 以 ...
Hadoop Hive概念学习系列之hive里的扩展接口（CLI、Beeline、JDBC）（十六）
<Spark最佳实战陈欢>写的这本书,关于此知识点,非常好,在94页. hive里的扩展接口,主要包括CLI(控制命令行接口).Beeline和JDBC等方式访问Hive. CLI和B ...
Hive详解
1. Hive基本概念 1.1 Hive简介 1.1.1 什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能. 1.1 ...

随机推荐

[Swift]LeetCode808. 分汤 | Soup Servings
There are two types of soup: type A and type B. Initially we have N ml of each type of soup. There a ...
Redis 设计与实现（五）--多机数据库的实现
多机数据库的实现一.复制 slaveof 主服务器ip地址.形成主从关系. 1.同步从向主服务器发送sync命令. 主服务器收到sync命令执行bgsave,生成rdb文件,缓冲区同时记录从 ...
ubuntu-18.04 设置开机启动脚本
ubuntu-18.04 设置开机启动脚本参阅下列链接 https://askubuntu.com/questions/886620/how-can-i-execute-command-on-sta ...
ThinkPHP Redis实现模拟队列
1.入队操作: //入队 public function enqueue() { $redis = new \Redis(); $redis->connect('127.0.0.1',6379) ...
zookeeper实现项目初始化缓存以及同步监听
Spring-利用InitializingBean接口和zookeeper实现项目初始化缓存以及同步监听 1.先贴出几个需要用到的工具类 ZkClientUtils import com.ithzk. ...
BBS论坛（二十一）
21.1.编辑轮播图功能完成 (1)cms_banners.html 把属性绑定到<tr>上面,方便找到各属性的值 <tbody> {% for banner in banne ...
java代码之美（1）---Lambda
Lambda 一.概述 1.什么是Lambda表达式 Lambda 表达式是一种匿名函数,简单地说,它是没有声明的方法,也即没有访问修饰符.返回值声明和名字. 它可以写出更简洁.更灵活的代码.作为一种 ...
HashTable与ConcurrentHashMap的区别
.NET Core中的路由约束
背景介绍上周给大家分享了Nancy in .NET Core学习笔记 - 路由之后, 就一直在考虑.NET Core能否实现和Nancy中一样的路由约束, 最近查阅了一下MSDN及一些国外博客, 发 ...
MySQL优化指南
当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化: 单表优化除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑.部署.运维的各种复杂度,一般以整型 ...