hive使用过的基本命令
命令:完成操作
hive:进去hive
show databases:显示 所有database
use wizad: 使用database wizad,或者如use aso
show tables:显示当前database下的所有表
show columns from table_name from database_name; 或show columns from database_name.table_name; :显示表中列名称
show grants for user_name@localhost;:显示一个用户的权限,显示结果类似于grant 命令
show index from table_name;:显示表的索引
show logs;:显示BDB存储引擎的日志
show warnings;:显示最后一个执行的语句所产生的错误、警告和通知
show errors;:只显示最后一个执行语句所产生的错误
desc table_name:显示表信息(字段、分区)
desc formatted wizad_mdm_raw_hdfs;:显示表详细信息 (字段、分区、路径、格式等)
效果如下:
limit使用:
select * from app_data limit 100;
count:
select count(*) from app_data;
count非常耗费时间,下面有个别人写的小例子。
SELECT type ,
count(*) ,
count(DISTINCT u) ,
count(CASE WHEN plat=1 THEN u ELSE NULL) ,
count(DISTINCT CASE WHEN plat=1 THEN u ELSE NULL) ,
count(CASE WHEN (type=2 OR type=6) THEN u ELSE NULL) ,
count(DISTINCT CASE WHEN (type=2 OR type=6) THEN u ELSE NULL)
FROM t WHERE dt in ("2012-1-12-02", "2012-1-12-03")
GROUP BY type
ORDER BY type ;
hive表按partition查询,效率高:
show partitions table_name;:显示表table_name分区
show partitions wizad_mdm_raw_hdfs; :
day=2014-12-20/adn=3
day=2014-12-21/adn=3
day=2014-12-21/adn=5
descformatted t2 partition (pt = '2014-10-17');:查看分区属性
建分区两种:
1,建表时建分区:
CREATE TABLE tab(
column1 STRING,
columnN STRING
) partitioned BY (day STRING);
2,在已存在表上加分区:
alter table wizad_mdm_raw_hdfs add partition (day='2014-12-20',adn='3') location '/user/wizad/data/wizad/raw/2014-12-20/3_1/';
alter table wizad_mdm_raw_hdfs add partition (day='2014-12-20',adn='5') location '/user/wizad/data/wizad/raw/2014-12-20/5_1/';
删除分区:
ALTER TABLE wizad_mdm_raw_hdfs DROP PARTITION (day='2014-12-23',adn='3');
ALTER TABLE wizad_mdm_raw_hdfs DROP PARTITION (day='2014-12-23',adn='5');
修改表
ALTER TABLE old_table_name RENAME TO new_table_name;:重命名
ALTER TABLE tab1 ADD COLUMNS (c1 INT, c2 STRING);:添加字段
创建外部表:
CREATE EXTERNAL TABLE wizad_mdm_dev_lmj_mapping_cookie (
cookie_id STRING,
guid STRING
) ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
stored as textfile
location '/user/wizad/tmp/mapping_cookie/';
格式是:
CREATE EXTERNAL TABLE tab (
column1STRING,
column2STRING,
column3STRING,
column4STRING,
columnNSTRING
) ROW FORMATDELIMITED
FIELDSTERMINATED BY '\t'
stored astextfile
location'hdfs://namenode/tmp/lmj/tab/';
hive语句执行环境相关参数设定:
SET mapred.job.queue.name=queue3;
SET hbase.client.scanner.caching=5000;
SET hbase.zookeeper.quorum=datanode06,datanode07,datanode08;
set zookeeper.znode.parent=/hbase;
set hbase.regionserver.lease.period=180000;
将查询结果保存到本地
INSERT OVERWRITE LOCAL DIRECTORY '/home/wizad/lmj/'
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
select cookie_id,rowkey,fixeddim_map
from wizad_mdm_main_from_hbase as a JOIN wizad_mdm_dev_lmj_edition_20141120 as w
ON (w.guid = a.rowkey);
这里有一个优化的小例子:http://www.myexception.cn/internet/477451.html
hive使用过的基本命令的更多相关文章
- Hive基本命令整理
创建表: hive> CREATE TABLE pokes (foo INT, bar STRING); Creates a table called pokes with t ...
- Hive基本命令解析
1. Hive的分区作用 命令:创建分区 create table t_sz_part(id int, name string) partitioned by (country string) row ...
- Hive shell 基本命令
首先连接 hive shell 直接输入 hive启动, 使用--开头的字符串来表示注释 hive>quit; --退出hive hive> exit; --exit会影响之前的使用,所以 ...
- Hive学习之七《 Sqoop import 从关系数据库抽取到HDFS》
一.什么是sqoop Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql.postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 :MySQL ...
- Hive基础概念、安装部署与基本使用
1. Hive简介 1.1 什么是Hive Hives是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能. 1.2 为什么使用Hive ① 直接使用 ...
- docker安装hive笔记
前两篇文章介绍了docker的基本命令如何安装hadoop 那么大家会比较了解docker的基本语法的安装过程.那么咱们今天来一起安装一下hive. 安装 1.下载gitHub,地址:https:// ...
- Hive/hbase/sqoop的基本使用教程~
Hive/hbase/sqoop的基本使用教程~ ###Hbase基本命令start-hbase.sh #启动hbasehbase shell #进入hbase编辑命令 list ...
- Hive Shell 命令详解
Hive服务介绍 Hive默认提供的cli(shell)服务,如果需要启动其他服务,那么需要service参数来启动其他服务,比如thrift服务.metastore服务等.可以通过命令hive -- ...
- Hive 1.2.1&Spark&Sqoop安装指南
目录 目录 1 1. 前言 1 2. 约定 2 3. 服务端口 2 4. 安装MySQL 2 4.1. 安装MySQL 2 4.2. 创建Hive元数据库 4 5. 安装步骤 5 5.1. 下载Hiv ...
随机推荐
- Android自定义ViewGroup(四、打造自己的布局容器)
转载请标明出处: http://blog.csdn.net/xmxkf/article/details/51500304 本文出自:[openXu的博客] 目录: 简单实现水平排列效果 自定义Layo ...
- openJdk和sun Jdk区别和安装
openJdk和sun jdk的区别 使用过LINUX的人都应该知道,在大多数LINUX发行版本里,内置或者通过软件源安装JDK的话,都是安装的OpenJDK, 那么到底什么是OpenJDK,它与SU ...
- Android全屏截图的方法,返回Bitmap并且保存在SD卡上
Android全屏截图的方法,返回Bitmap并且保存在SD卡上 今天做分享,需求是截图分享,做了也是一个运动类的产品,那好,我们就直接开始做,考虑了一下,因为是全屏的分享,所有很自然而然的想到了Vi ...
- CUSTOM.PLL的使用
在开发中对系统标准form的修改一般不建议修改系统原有FORM,对所需要修改的内容一般写在CUSTOM.PLL里即可,应为每个form运行的时候都会调用CUSTOM.PLL具体概念性东西可参考网上资料 ...
- jvm java虚拟机 新生代的配置
1.1.1.1. -Xmn参数 参数-Xmn1m可以用于设置新生代的大小.设置一个较大的新生代会影响老生代的大小,因为这两者的总和是一定的,这个系统参数对于系统性能以及GC行为有很大的影响,新生代一般 ...
- ROS_Kinetic_23 ROS流行版本和相关书籍汇总
目前,ROS使用的主流版本主要是下面四种:Hydro,Indigo,Jade,Kinetic. Distro Release date Poster Tuturtle, turtle in tutor ...
- 05 Activity生命周期
生命周期:一个Activity从创建到销毁经过的全部方法 1.onCreate() 创建一个Activity的时候执行的方法 2.onStart()Activity可以被看见到时候无法交互(没有焦点) ...
- C语言获取文件大小
C语言是一种比较底层的语言,有时在其他语言中很容易操作的事情,在C语言中就比较麻烦,例如获取一个文件的大小.Java中File类有个length函数,Python中os.path包中有个getsize ...
- Maven原型骨架及常见问题
关于Maven原型工程的制作就不在这里详细介绍了,具体细节请参考之前的文章:定制Maven原型生成项目 下面分享制作和使用Maven原型工程时碰到的常见问题,以及原型的上传和使用方法. 1.模块路径问 ...
- Ubuntu 15.10下的WebStorm-11.0.3完美破解
由于最新的JetBrains 发布了最新版本的IntelliJ IDEA的各个版本,而且更换了注册机的使用方式,这就导致了之前对WebStorm的破解方法不能在使用了.所以我们就必须另寻他法咯.如题, ...