Hive基础之Hive的复杂类型

ARRAY

一组有序字段，字段的类型必须相同。Array(1,2)

create table hive_array(ip string, uid array<string>)

row format delimited

fields terminated by ','

collection items terminated by '|'

stored as textfile;

加载数据

load data local inpath "/home/spark/software/data/hive_array.txt" overwrite into table hive_array;

hive_array.txt

192.168.1.1,www.baidu.com|www.google.com|www.qq.com

192.168.1.2,www.baidu.com|www.sina.com|www.sohu.com

192.168.1.3,www.qq.com|www.163.com|www.youku.com

select * from hive_array;

192.168.1.1     ["www.baidu.com","www.google.com","www.qq.com"]

192.168.1.2     ["www.baidu.com","www.sina.com","www.sohu.com"]

192.168.1.3     ["www.qq.com","www.163.com","www.youku.com"]

使用下标访问，下标从0开始：

select ip, uid[] as id from hive_array;

192.168.1.1     www.baidu.com

192.168.1.2     www.baidu.com

192.168.1.3     www.qq.com

查看数据长度：

select size(uid) from hive_array;

3

3

3

数组查找：

select * from hive_array where array_contains(uid, "www.baidu.com");

192.168.1.1     ["www.baidu.com","www.google.com","www.qq.com"]

192.168.1.2     ["www.baidu.com","www.sina.com","www.sohu.com"]

MAP

一组无序的键值对，键的类型必须是原子的，值可以是任何类型，同一个映射的键的类型必须相同，值的类型也必须相同。Map('a',1,'b',2)

create table hive_map(ts string, ip string, type string, logtype string, request Map<string,string>, response Map<string, string>)

row format delimited fields terminated by '#'

collection items terminated by '&'

map keys terminated by '='

stored as textfile;

hive_map.txt

2014-03-03 12:22:34#127.0.0.1#get#amap#src=123&code=456&cookie=789#status=success&time=2s

2014-03-03 11:22:34#127.0.0.1#get#autonavi#src=123&code=456#status=success&time=2s&cookie=789

加载数据：

load data local inpath "/home/spark/software/data/hive_map.txt" overwrite into table hive_map;

查看表结构: desc hive_map

ts                      string                  None

ip                      string                  None

type                    string                  None

logtype                 string                  None

request                 map<string,string>      None

response                map<string,string>      None

查看所有字段：

select * from hive_map;

2014-03-03 12:22:34     127.0.0.1       get     amap    {"src":"123","code":"456","cookie":"789"}       {"status":"success","time":"2s"}

2014-03-03 11:22:34     127.0.0.1       get     autonavi        {"src":"123","code":"456"}      {"status":"success","time":"2s","cookie":"789"}

查看map中指定的字段：

select request['src'], request['code'], request['cookie'] from hive_map;

123     456     789

123     456     NULL

STRUCT

一组命名的字段，字段类型可以不同。 Struct('a',1,2,0)

create table hive_struct(ip string, user struct<name:string, age:int>)

row format delimited fields terminated by '#'

collection  items terminated by ':'

stored as textfile;

hive_struct.txt

192.168.1.1#zhangsan:40

192.168.1.2#lisi:50

192.168.1.3#wangwu:60

192.168.1.4#zhaoliu:70

加载数据：

load data local inpath "/home/spark/software/data/hive_struct.txt" overwrite into table hive_struct;

查询所有字段：

select * from hive_struct;

192.168.1.1     {"name":"zhangsan","age":40}

192.168.1.2     {"name":"lisi","age":50}

192.168.1.3     {"name":"wangwu","age":60}

192.168.1.4     {"name":"zhaoliu","age":70}

查询指定字段：

select user.name, user.age from hive_struct;

zhangsan        40

lisi    50

wangwu  60

zhaoliu 70

Hive基础之Hive的复杂类型的更多相关文章

Hive基础之Hive数据类型
Hive数据类型参考:中文博客:http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2843448.html 英文:https: ...
Hive基础之Hive体系架构&运行模式&Hive与关系型数据的区别
Hive架构 1)用户接口: CLI(hive shell):命令行工具:启动方式:hive 或者 hive --service cli ThriftServer:通过Thrift对外提供服务,默认端 ...
Hive基础之Hive环境搭建
Hive默认元数据信息存储在Derby里,Derby内置的关系型数据库.单Session的(只支持单客户端连接,两个客户端连接过去会报错): Hive支持将元数据存储在关系型数据库中,比如:Mysql ...
Hive基础之Hive的存储类型
Hive常用的存储类型有: 1.TextFile: Hive默认的存储类型:文件大占用空间大,未压缩,查询慢: 2.Sequence File:将属于以<KEY,VALUE>的形式序列化到 ...
Hive基础之Hive开启查询列名及行转列显示
Hive默认情况下查询结果里面是只显示值: hive> select * from click_log; OK ad_101 :: ad_102 :: ad_103 :: ad_104 :: a ...
Hive基础之Hive与关系型数据库的比较
Hive与关系型数据库的比较使用Hive的CTL(命令行接口)时,你会感觉它很像是在操作关系型数据库,但是实际上,Hive和关系型数据库有很大的不同. 1)Hive和关系型数据库 ...
Hive基础之Hive表常用操作
本案例使用的数据均来源于Oracle自带的emp和dept表创建表语法: CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name ...
Hive基础之Hive是什么以及使用场景
Hive是什么1)Hive由facebook开源,构建在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库:2)一种可以存储.查询和分析存储在Hadoop 中的大规模数据的机 ...
Hive基础(1)
Hive基础(1) Hive的HQL(2) 1. Hive并不是分布式的,它独立于机器之外,类似于Hadoop的客户端. 2. 元数据和数据的区别,前者如表名.列名.字段名等. 3. Hive的三种安 ...

随机推荐

B - Build The Electric System 求强连通的最小和//lxm
有n个城市,有m条线路,每条线路a,b,len表示a到b的线路需要花费len的费用维修,要求能将所有城市联通的最小维修花费按照排序排一下然后利用并查集解决 #include <iostream ...
原生JS 的cookie和jq的cookie,
COOKIE基础及应用:1.什么是COOKIE==>页面用来保存信息,比如:自动登录,记住用户名2.COOKIE的特性: --同一个网站中,所有的页面共享同一套cookie --数量,大小有 ...
Koa下http代理
前言最近做管理后台的重构或者说重做. 至于为什么要重构. 随意的解释: 是原来写的人走了. 客观的解释: 用的人觉得不好用维护的人员找不到北再多一点解释: express + ejs的混合编写 ...
用newLISP通过SMTPserver发送邮件
版权声明:本文为博主原创文章.未经博主同意不得转载. https://blog.csdn.net/sheismylife/article/details/26633073 直接使用标准模块smtpx. ...
u-boot分析
4.Bootloader:u-boot.2009.08分析与移植4.1:分析u-boot根文件夹下的Makefile,能够看到uboot编译的顺序例如以下,由此可知编译运行的第一个文件是cpu/$(C ...
将svnserve部署为后台服务
由于svnserve运行模式没有部署为后台服务,很容易被人误关掉.于是在网上查了一下,发现也已经有人总结了.Copy过来,以作备忘. 以前的svnserve要想成为windows服务,必须依赖于svn ...
NOSQL之MONGODB
MongoDB 基于分布式文件存储的数据库.由 C++ 语言编写.旨在为 WEB 应用提供可扩展的高性能数据存储解决方案,它是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富, ...
js 逻辑的短路运算
&& 与运算同时为true,才为true: 表达式1为false,不用看表达式2: || 或运算有一个为true,就为true: 表达式1为true,不用看表达式2: && ...
go test 初始化--- TestMain的使用
go test 功能,提高了开发和测试的效率. 有时会遇到这样的场景: 进行测试之前需要初始化操作(例如打开连接),测试结束后,需要做清理工作(例如关闭连接)等等.这个时候就可以使用TestMain( ...
html 子元素和父元素都监听了 click 事件，点击子元素时为何先触发的是父元素的 click 事件？
先上一段代码,点击子元素时先触发的是父元素的 click 事件 <html> <head> <script type="text/javascript" ...

Hive基础之Hive的复杂类型

Hive基础之Hive的复杂类型的更多相关文章

随机推荐

热门专题