HIVE HSQL 基本操作命令

创建表：

　　hive>create table tablename(id int,name string,password string);

　　创建一个名字为tablename的表，表的属性有int id; string name; string password;

创建表时指定分隔符

　　hive> create table test1(name string,count int)row format delimited fields terminated by '/t';

加载表

　　hive> load data inpath '/user/hadoop/output7/part-r-00000' into table test1;

创建一个新表，结构与其他一样
　　hive> create table table1 like table2;

　　创建一个表table1,表结构跟table2一样;

创建分区表

　　hive> create table table1(id int,line string) partitioned by (dt string,country string);

显示表里有多少条记录(count 数大于50的有多少条记录)

　　hive>select count(*) from tablename where count>50;

排序用法order by (查询count 数大于50并排序)

　　 select * from test2 where count > 50 order by count;

显示表中有多少分区

　　hive> show partitions table1;

显示所有表

　　hive> show tables;

显示所有与u开头的表

　　hive> show tables 'u*';

显示表的结构信息

　　hive> describe test1;

修改表名字

　　hive> alter table table1 rename to test3;

在原表上新添加一列

　　hive> alter table test1 add columns(new_col2 int comment 'a commment');

　　hive> alter table test1 add columns(new_col3 int);

删除表

　　hive> drop table test3;

从本地文件加载数据：
　　hive> LOAD DATA LOCAL INPATH '/home/hadoop/input/ncdc/micro-tab/sample.txt' OVERWRITE INTO TABLE records;

加载分区表

　　hive> load data inpath '/user/hive/warehouse/clickstream_log/dt=2016-11-29/part-r-00000' overwrite into table clickstream_log PARTITION(dt = '2016-11-30');

显示所有函数

　　hive> show functions;

查看函数的用法

　　hive> describe function substr;

查看数组、map、结构
　　hive> select col1[0],col2['b'],col3.c from complex;

内连接：
　　hive> SELECT sales.*, things.* FROM sales JOIN things ON (sales.id = things.id);

查看hive为某个查询使用多少个MapReduce作业
　　hive> Explain SELECT sales.*, things.* FROM sales JOIN things ON (sales.id = things.id);

外连接：
　　hive> SELECT sales.*, things.* FROM sales LEFT OUTER JOIN things ON (sales.id = things.id);
　　hive> SELECT sales.*, things.* FROM sales RIGHT OUTER JOIN things ON (sales.id = things.id);
　　hive> SELECT sales.*, things.* FROM sales FULL OUTER JOIN things ON (sales.id = things.id);

in查询：Hive不支持，但可以使用LEFT SEMI JOIN
　　hive> SELECT * FROM things LEFT SEMI JOIN sales ON (sales.id = things.id);

Map连接：Hive可以把较小的表放入每个Mapper的内存来执行连接操作
　　hive> SELECT /*+ MAPJOIN(things) */ sales.*, things.* FROM sales JOIN things ON (sales.id = things.id);

INSERT OVERWRITE TABLE ..SELECT：新表预先存在
　　hive> FROM records2
　　> INSERT OVERWRITE TABLE stations_by_year SELECT year, COUNT(DISTINCT station) GROUP BY year
　　> INSERT OVERWRITE TABLE records_by_year SELECT year, COUNT(1) GROUP BY year
　　> INSERT OVERWRITE TABLE good_records_by_year SELECT year, COUNT(1) WHERE temperature != 9999 AND (quality = 0 OR quality = 1 OR quality = 4 OR quality = 5 OR quality = 9) GROUP BY year;

CREATE TABLE ... AS SELECT：新表表预先不存在
　　hive>CREATE TABLE target AS SELECT col1,col2 FROM source;

创建视图：
　　hive> CREATE VIEW valid_records AS SELECT * FROM records2 WHERE temperature !=9999;

查看视图详细信息：
　　hive> DESCRIBE EXTENDED valid_records;

-------------------------------------------------------------------------------------------------------------------------------------

传统数据库：
添加：

insert into 表名 values();
修改：

update 表名 set a=b where b=c;
删除：

delete from 表名where a=b;
查询：

select * from 表名 where a=b;

HIVE HSQL 基本操作命令的更多相关文章

hive Hsql
show databases; use flume; show tables; desc flume; alter table table_name add columns(dt string); a ...
《OD大数据实战》Hive入门实例
官方参考文档:https://cwiki.apache.org/confluence/display/Hive/LanguageManual 一.命令行和客户端 1. 命令窗口 1)进入命令窗口 hi ...
大数据系列之数据仓库Hive安装
Hive系列博文,持续更新~~~ 大数据系列之数据仓库Hive原理大数据系列之数据仓库Hive安装大数据系列之数据仓库Hive中分区Partition如何使用大数据系列之数据仓库Hive命令使用 ...
hadoop面试100道收集（带答案）
1.列出安装Hadoop流程步骤 a) 创建hadoop账号 b) 更改ip c) 安装Java 更改/etc/profile 配置环境变量 d) 修改host文件域名 e) 安装ssh 配置无密码登 ...
《OD学Oozie》20160807Oozie
一.引入 MapReduce Job Hive 脚本任务同一个业务:先后.定时调度工作流: 定义工作流程 activity jbpm oozie: 大数据工作流定义与调度框架专门定义与调度Map ...
shell_hive
(1)获取参数:从shell文件传来参数,调用:$1,$2,$3 load_date=$1 clearn_date=`date -d"$2 day ago $load_date" ...
2. Hive常见操作命令整理
该笔记主要整理了<Hive编程指南>中一些常见的操作命令,大致如下(持续补充中): 1. 查看/设置/修改变量2. 执行命令3. 搜索相关内容4. 查看库表信息5. 创建表6. 分区7. ...
Hive常用操作命令
创建数据库>create database db_name;>create database if not exists db_name;//创建一个不存在的数据库final查看数据库&g ...
Hive记录-Beeline常用操作命令
Beeline和其他工具有一些不同,执行查询都是正常的SQL输入,但是如果是一些管理的命令, 比如进行连接,中断,退出,执行Beeline命令需要带上"!",不需要终止符.常用命令 ...

随机推荐

linux 下Shell编程（四）
for循环应用实例 for 循环可以对一个记录集中地数据依次集中地数据依次进行处理. #!/bin/bash #4.13.sh for clear #看下图区别 for((i=1:i<1 ...
第二十二篇：C++中的多态机制
前言封装性,继承性,多态性是面向对象语言的三大特性.其中封装,继承好理解,而多态的概念让许多初学者感到困惑.本文将讲述C++中多态的概念以及多态的实现机制. 什么是多态? 多态就是多种形态,就是许多 ...
POJ2417 Discrete Logging【BSGS】
Discrete Logging Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 5577 Accepted: 2494 ...
爬虫实战【4】Python获取猫眼电影最受期待榜的50部电影
前面几天介绍的都是博客园的内容,今天我们切换一下,了解一下大家都感兴趣的信息,比如最近有啥电影是万众期待的? 猫眼电影是了解这些信息的好地方,在猫眼电影中有5个榜单,其中最受期待榜就是我们今天要爬取的 ...
#1589 : 回文子串的数量(Manacher)
#1589 : 回文子串的数量时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述给定一个字符串S,请统计S的所有|S| * (|S| + 1) / 2个子串中(首尾位置不 ...
confluence数据备份
上篇文章总结了confluence的docker-compose的搭建,但是考虑到数据安全性问题,需要最数据库进行备份因为mysql的data目录已经挂载到宿主机,所以直接对mysql容器的宿主机进 ...
坑爹的 HTTPClient java.lang.NoSuchFieldError: INSTANCE
项目中需要用到httpclient ,maven配置如下 <dependency> <groupId>org.apache.httpcomponents</groupId ...
疯狂创客圈 JAVA死磕系列总目录
无编程不创客,无案例不学习.疯狂创客圈,一大波高手正在交流.学习中! 疯狂创客圈 Java 死磕系列: [博客园总入口] QQ群:104131248 [Java 聊天室] 实战从0开始,打造100 ...
从jarray中删除指定元素的问题
string jsonText = "[{\"a\": \"aaa\",\"b\": \"bbb\",\&qu ...
ajax图片上传功能
一.应用场景当用户需要上传图片当做自己的头像时,预览的时候该图片需要在本地预览,不应该通过网络从服务器上取到之后预览二.实现方法 1.方法1: 注释:给上传文件的input标签绑定一个change ...

HIVE HSQL 基本操作命令

HIVE HSQL 基本操作命令的更多相关文章

随机推荐

热门专题