基础语句

`CREATE DROP` 建表、删表

建表

--------------------------------------

-- 1. 直接建表

--------------------------------------

-- 创建非分区表时，省去后半部分即可

create table if not exists table_name(

id string comment 'id ',

num string comment '数值'

)

partitioned by (

ym string comment  '月份 '

);

--------------------------------------

-- 2. 复制其他表的表结构

--------------------------------------

create table if not exists new_table like old_table;

--------------------------------------

-- 3. 从其他表选取数据创建并插入新表

--------------------------------------

create table if not exists new_table as

select * from  old_table;

删表

drop table table_name ;

`ALTER` 更改表结构

分区

添加分区

alter table table_name

add if not exists partition (y='2016',m='12');

删除分区

ALTER TABLE table_name DROP IF EXISTS PARTITION (ym='201706');

重命名分区

 ALTER TABLE table_name PARTITION (y='2017',m='05')

 RENAME TO PARTITION (y='2017',m='06');

列

删除列

ALTER TABLE table_name DROP COLUMN id;

增加列

Alter table table_name add COLUMNS (id string comment '代号');

修改列 (此处可用于修改字段注释)

ALTER TABLE table_name CHANGE id level string comment '层级代号';

替换列

ALTET TABLE table_name REPLACE COLUMNS

(id_new string COMMENT '新字段1', level_new string COMMENT '新字段2');

表

重命名表名

ALTER TABLE old_table RENAME TO new_table;

`INSERT` 插入

插入单条数据（Hive 已支持单条插入）

 insert into table_name  values(201705,'lol');

插入分区表

 insert overwrite table  table_name   PARTITION (y='2017',m='01')

 select *

 from table_name_2

  where pt = concat('2017','01');

`LOAD` 载入

重写载入分区表（非分区表同理）

LOAD DATA LOCAL INPATH 'total.txt' overwrite into table table_name partition (y='2016',m='12');

其他语句

其他基础SQL类似的语句不再赘述，此处再多列举几个常用语句：

-- 列举库或表

SHOW DATABASES/TABLES;

-- 根据关键字查找库或表

SHOW DATABASES/TABLES LIKE "*keyword*";

-- 列举所有函数

SHOW FUNCTIONS;

-- 查看分区

SHOW PARTITIONS test_table;

-- 查看建表语句

SHOW CREATE TABLE table_name;

-- 详细描述，包括建表时间、最后更新时间、行数统计等。

DESC FORMATTED test_table;

-- 解释语句

EXPLAIN select * from dual;

-- 清空表

truncate table table_name;

函数、技巧、方法

执行顺序理解
根据 explain 语句的使用发现，在执行以下语句时：
在TableScan步骤，where条件中若有分区筛选条件且目标分区确实存在、且判断方式为=时，自动进行过滤，然后再在Filter Operator进行其他条件的筛选：
predicate: (latitude is not null and (UDFToDouble(longitude) > 100.0) AND (UDFToDouble(ym) > 201701.0)) (type: boolean)
predicate: (lat_avg is not null and lng_avg is not null) (type: boolean)
所以， 先join在where和先where在join是等等价的

  select b.*, a.name,a.price,a.city

  from table_name_a a

  join table_name_b b

  on round(b.lng_avg,2) = round(a.longitude,2)

  and round(b.lat_avg,2) = round(a.latitude,2)

  where  a.longitude  >100

shell内通过hive -v " "调用执行HiveQL语句时,如需要注释，请注意转义问题
1. 注释的那条语句不能含有分号;
2. 注释语句后接语句尽量避免导jar包的语句
3. 避免使用 /* */
选择除某几个字段外的所有字段
当某个表的字段特别多，若想选取除某几个字段外的所有字段时，这时语句写起来就会很麻烦，比如有时两个表join的条件的字段名相同时，只能保留一个字段。但有一个方法可以解决这个问题，如下：

set hive.support.quoted.identifiers=none;

select `(y|m|d)?+.+` from dual;

需注意:: 括号内不能有空格; 在shell里调用时需要对这个反引号进行转义

通过concat_ws、collect_set和str_to_map的使用，实现字符串转map

str_to_map(concat_ws(',',collect_set(concat_ws(':',key, cast(value as string)))))

avg()函数会自动剔除NULL，总数除以非NULL个数
字符串截取函数substr、substring是等价的
substr(string A, int start, int len)
substring(string A, int start, int len)
x between a and b 等同于 a<= x <=b
子查询加最好要加别称
报错：Failed rule: ‘identifier’ in subquery source
解决：子查询加别称
设置队列问题， mapred.job.queue.name与mapreduce.job.queuename

set mapred.job.queue.name=queue_xx;

MRv2重新命名了MRv1中的所有配置参数，但兼容MRv1中的旧参数，只不过会打印一条警告日志提示用户参数过期。详见此篇博文。

查询表的实际更新情况
desc formatted 的结果往往只有CreateTime，LastAccessTime经常为UNKNOWN的状态，可以用hadoop 指令去查询数据文件的真实更新时间：hadoop fs ‐ls truePath/databaseName.db/tableName/

调优

占个坑，有时间再来填

Hive里的坑点

limit m,n 的问题
使用语句：create table a as select * from b limit m,n时，会导致新建表a内无数据，解决办法:
1. 看似可以其实并不好使： create table a as select * from (select * from b limit m,n ) t
2. 解决：使用row_number() 加序号,根据序号选取
NULL 值问题
1. length(NULL) 等于NULL
2. NULL与空字符串:
  由下可见：NULL不可以与字符串或数值比较，''可与字符串比较但不可与数值比较

hive (xx_safe)> select * from dual;

OK

dual.lol

100

50

1

1

2

fangjiale

NULL

   --(此处为'')

hive (xx_safe)> select * from dual where lol !='1';

OK

dual.lol

fangjiale

100

50

2

   --(此处为'')

hive (xx_safe)> select * from dual where lol !=1;

OK

dual.lol

100

50

2

Hive HiveQL基础知识及常用语句总结的更多相关文章

Hive 这些基础知识，你忘记了吗？
Hive 其实是一个客户端,类似于navcat.plsql 这种,不同的是Hive 是读取 HDFS 上的数据,作为离线查询使用,离线就意味着速度很慢,有可能跑一个任务需要几个小时甚至更长时间都有可能 ...
Shell编程(二)——shell的基础知识及常用命令
shell的基础知识一.bash有以下特点: 1.记录命令历史 2.指令和文件名补全 3.别名 alias rm='rm -i' 4.通配符 * 0个或多个字符 ?匹配一个字符 5 输入输出重定向 ...
Hive(一)基础知识
一.Hive的基本概念 (安装的是Apache hive 1.2.1) 1.hive简介 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表, 并提供类 SQ ...
MySQL基础知识和常用命令总结
说明:以下内容是阅读书籍<<MySQL必知必会>>的摘要和总结检索数据排序检索数据过滤数据使用通配符过滤使用正则表达式进行搜索创建计算字段使用数据处理函数汇总数 ...
loadrunder之脚本篇——脚本基础知识和常用操作
1)编码工具设置自动补全输入Tools->General Options->Environment->Auto complete word 显示功能语法Tools->Genr ...
[基础学习]MySQL常用语句命令总结
前言相信平时大家在开发时都会使用MySQL数据库,它是目前比较火的一款数据库工具,对于大多数企业的业务来说,MySQL可以很完美地支持了. 很多时候我们都是借助mysql可视化工具操作mysql,虽 ...
Git基础知识与常用命令
一:相关概念: 1:工作区(Working Directory): 就是你在电脑里能看到的目录 2:版本库(Repository): 工作区有一个隐藏目录.git,这个不算工作区,而是Git的版本库. ...
（转）rabbitMQ基础知识及命令语句
摘要: 整理rabbitmq的用户管理相关知识,备忘安装最新版本的rabbitmq(3.3.1),并启用management plugin后,使用默认的账号guest登陆管理控制台,却提示登陆失败. ...
python - 基础知识，if语句
一.认识计算机计算机是一个高度集成的电子电路. 组成:CPU(中央处理器).内存 .主板 .电源(心脏) .显示器 .键盘 .鼠标 .显卡(NAVID,AMD) .硬盘操作系统 :Windo ...

随机推荐

27 October in ss
Contest A. chrono 计算某年的干支纪年法年份. Too easy. 然而我忘记 C++ 取模运算是向0取整.然而数据太水,还是有 90 分. B. clock 计算某时刻时针和分针的夹 ...
[CSP-S模拟测试]:异或（树状数组+LCA）
题目传送门(内部题21) 输入格式第一行一个字符串$str$,表示数据类型.第二行一个正整数$k$,表示集合$K$的大小,保证$k>1$.接下来$k$行每行$k$个数,第$i$行第$j$个数表 ...
centos7运行yum报如下提示：Run "yum repolist all" to see the repos you have
centos7运行yum报如下提示: There are no enabled repos. Run "yum repolist all" to see the repos you ...
斯坦福【概率与统计】课程笔记（二）：从EDA开始
探索性数据分析(Exploratory Data Analysis) 本节课程先从统计分析四步骤中的第二步:EDA开始. 课程定义了若干个术语,如果学习过机器学习的同学,应该很容易类比理解: popu ...
HBase最佳实践－读性能优化策略
任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题.HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少.总结 ...
CSS深入理解float
初衷:图片环绕效果 1.会使父元素高度塌陷 2.包裹性 3.让元素block化 4.去空格化 5.清除浮动 .clearfix::after{ content:""; disp ...
Groovy学习：第五章学习回顾groovy
一.groovy是什么简单地说,Groovy 是下一代的java语言,跟java一样,它也运行在 JVM 中. 作为跑在JVM中的另一种语言,groovy语法与 Java 语言的语法很相似.同时,G ...
vue 实现active点击图片切换
循环条件下: 1.点击函数@click="active(index)" 获取点击的位置 2.讲索引值传给class,点击哪一个则显示哪一个的样式 3.在data添加ins的初始值 ...
empty视为空的条件
/** * empty视为空的条件: * (1)."" (空字符串) * (2).0 (作为整数的0) * (3).0.0 (作为浮点数的0) * (4)."0" ...
Vue小白篇 -Vue 的模板语法
可以插入任何你想插入的内容,除了 if-else if-else用三元运算符代替 <div id="box">  <h2> ...

Hive HiveQL基础知识及常用语句总结

基础语句

CREATE DROP 建表、删表

ALTER 更改表结构

分区

列

表

INSERT 插入

LOAD 载入

其他语句

函数、技巧、方法

调优

Hive里的坑点

Hive HiveQL基础知识及常用语句总结的更多相关文章

随机推荐

热门专题

`CREATE DROP` 建表、删表

`ALTER` 更改表结构

`INSERT` 插入

`LOAD` 载入