HIVE - HIVEQL学习笔记
Hive Learning
HIVEQL和MYSQL最为接近
数据操作
SHOW TABLES IN crm_integration
Show tables 'dim_con*'
DESCRIBE EXTENDED crm_integration.itg_fact_sales_order
DESCRIBE FORMATTED crm_integration.itg_fact_sales_order
show partitions crm_integration.itg_fact_sales_order --查看表中所有分区
DELETE TABLE
DROP TABLE IF EXSTS employees
.Trash(需要开启回收站功能)
ALTER TABLE log_MESSAGES RENAME TO logmsgs;
ALTER TABLE table ADD PARTITION…
ALTER TABLE logmessages DROP IF EXISTS PARTITION (year = 2011, month =12, _day =2 )
ALTER TABLE log ADD COLUMNS(app_name STRING COMMENT ‘application name’)
替换列:REPLACE
ARCHIVE PARTITION
保护:
ALTER TABLE logmessages DROP IF EXISTS PARTITION (year = 2011, month =12, day =2 ) ENABLE NO_DROP
ALTER TABLE logmessages DROP IF EXISTS PARTITION (year = 2011, month =12, day =2 ) ENABLE OFFLINE
装载数据
Load data local
Overwrite
集合数据类型中的元素提取:
SELECT name, subordinates[0] FROM employees;
SELECT name, deductions[“State Taxes”] FROM EMPLOYEES;
这里deductions列是一个map,jason格式。
引用struct中的元素,可以用点。
SELEFCT name, ADDRESS.CITY FROM EMPLOYEES;
正则表达式:
LIKE, RLIKE
LIMIT 2
谓词:
A<> B
A !=B
A is null
A IS NOT NULL
A LIKE B
A NOT LIKE B
A RLIKE B
A REGEXP B
JOIN(笛卡尔积) --消耗资源,不建议
LEFT OUTER JOIN
LEFT SEMI-JOIN:
返回左边表的记录,前提是记录对于右边表满足ON语句中的判定条件。Sql回通过IN…EXISTS结构来处理这种情况。
HIVE不支持RIGHT SEMI-JOIN
SEMI-JOIN比inner join要更高效。
SORT BY –每个reducer中对数据排序,局部排序过程
ORDER BY—全局有序
DISTRIBUTE BY –写在SORT BY 前面。
CLUSTER BY
数据类型:
CAST(SALARY AS FLOAT)
6.9 抽样查询:
RAND()
数据块抽样:
SELECT * FROM numbersflat TABLESAMPLE (0.1 PERCENT) s;
CREATE TABLE shipments2 LIKE shipment
索引:
Show FORMATTED INDEX ON employess
调优
EXPLAIN
EXPLAIN SELECT SUM(NUMBER) FROM onecol;
EXPLAIN EXTENDED
HIVE - HIVEQL学习笔记的更多相关文章
- HIVE优化学习笔记
概述 之前写过关于hive的已经有两篇随笔了,但是作者依然还是一枚小白,现在把那些杂七杂八的总结一下,供以后查阅和总结.今天的文章介绍一下hive的优化.hive是好多公司都在使用的东西,也有好多大公 ...
- hive kettle 学习笔记
学习网址 http://wiki.pentaho.com/display/BAD/Transforming+Data+within+Hive
- 60分钟内从零起步驾驭Hive实战学习笔记
本博文的主要内容是: 1. Hive本质解析 2. Hive安装实战 3. 使用Hive操作搜索引擎数据实战 SparkSQL前身是Shark,Shark强烈依赖于Hive.Spark原来没有做SQL ...
- 60分钟内从零起步驾驭Hive实战学习笔记(Ubuntu里安装mysql)
本博文的主要内容是: 1. Hive本质解析 2. Hive安装实战 3. 使用Hive操作搜索引擎数据实战 SparkSQL前身是Shark,Shark强烈依赖于Hive.Spark原来没有做SQL ...
- hive sql 学习笔记
1.coalesce 语法: COALESCE ( expression [ ,...n ] ) 参数: expression 任何类型的表达式. 返回类型: 返回数据类型优先级最高的 express ...
- hive学习笔记之六:HiveQL基础
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- hive学习笔记之一:基本数据类型
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- hive学习笔记之三:内部表和外部表
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- hive学习笔记之四:分区表
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- hive学习笔记之五:分桶
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
随机推荐
- getUserInfo和getUserProfile被废弃
之前得知获取用户头像和昵称的两个接口getUserInfo和getUserProfile被废弃了,于是我就想深入探究一下. 一直抱有一个疑问,为啥有getUserInfo和getUserProfile ...
- C# 元组类型和元组文本
从 C# 7.0 开始,可以使用元组类型和元组文本轻松实现此目的. 元组类型定义元 组元素的数据类型. 元组文本提供返回的元组的实际值. 在下面的示例中, (string, string, strin ...
- curl命令查用操作
curl -o /dev/null -s -w "http_code: %{http_code} http_connect:%{http_connect} content_type:%{co ...
- CVE-2020-1938 Tomcat AJP漏洞复现
一 漏洞环境 # vulhub靶场地址 https://github.com/vulhub/vulhub靶场还需要有python环境,pip,docker docker-composeGitHub上 ...
- python查找文件、移动、重命名、压缩
在文件同级目录下存在sourcefile.targetfile两个文件夹,源文件放在sourcefile import os import shutil Apath = os.path.dirname ...
- 洛谷 P4048更新题面
[JSOI2010]冷冻波 题目描述 WJJ 喜欢"魔兽争霸"这个游戏.在游戏中,巫妖是一种强大的英雄,它的技能 Frozen Nova 每次可以杀死一个小精灵.我们认为,巫妖和小 ...
- (app笔记)Memory Fill内存填充
Memory Fill 是实现app内存填充工具(运行内存,物理内存,网络空间内存) Used:已用内存 filled:未回收内存 Free:自由内存 1.Ram(Total Ram):手机运行内存 ...
- SSL certificate problem: unable to get local issuer certificate 错误解决
终端报了如下错误git SSL certificate problem: unable to get local issuer certificate 这个问题是由于没有配置信任的服务器HTTPS验证 ...
- 快速导出Redis某个List列表所有数据
Redis导出list数据 快速命令行 echo "lrange data_list_with_hash 0 25000" | ./redis-cli.exe -h 127.0.0 ...
- KingbaseES V8R3集群运维案例之---kingbase_monitor.sh启动”two master“案例
案例说明: KingbaseES V8R3集群,执行kingbase_monitor.sh启动集群,出现"two master"节点的故障,启动集群失败:通过手工sys_ctl启动 ...