Hive Shell常用操作

1.Hive非交互模式常用命令：

　　1) hive -e：从命令行执行指定的HQL，不需要分号：

% hive -e 'select * from dummy' > a.txt

　　2) hive –f：执行HQL脚本

% hive -f /home/my/hive-script.sql  --hive-script.sql是hql脚本文件

　　3) hive -i：进入Hive交互Shell时候先执行脚本中的HQL语句

% hive -i /home/my/hive-init.sql

　　4) hive -v：冗余verbose模式，额外打印出执行的HQL语句

　　5) hive -S：静默Slient模式，不显示转化MR-Job的信息，只显示最终结果

% hive -S -e ‘select * from student’

　　6)hive --hiveconf <property=value>：使用给定属性的值

$HIVE_HOME/bin/hive --hiveconf mapred.reduce.tasks= //启动时,配置reduce个数2（只在此session中有效）

　　7)hive --service serviceName：启动服务

　　8)hive [--database test]：进入CLI交互界面，默认进入default数据库。加上[]内容直接进入test数据库。

%hive --database test

3.Hive的交互模式下命令：

quit / exit：退出CLI

reset：重置所有的配置参数，初始化为hive-site.xml中的配置。如之前使用set命令设置了reduce数量。

set <key>=<value>：设置Hive运行时配置参数，优先级最高，相同key，后面的设置会覆盖前面的设置。

set –v：打印出所有Hive的配置参数和Hadoop的配置参数。

//找出和"mapred.reduce.tasks"相关的设置

hive -e 'set -v;' | grep mapred.reduce.tasks

add命令：包括add File[S]/Jar[S]/Archive[S] <filepath> *，向 DistributeCache 中添加一个或过个文件、jar包、或者归档，添加之后，可以在Map和Reduce task中使用。比如，自定义一个udf函数，打成jar包，在创建函数之前，必须使用add jar命令，将该jar包添加，否则会报错找不到类。

list 命令：包括list File[S]/Jar[S]/Archive[S]。列出当前DistributeCache中的文件、jar包或者归档。

delete 命令：包括 delete File[S]/Jar[S]/Archive[S] <filepath>*。从DistributeCache中删除文件。

//将file加入缓冲区

add file /root/test/sql;

//列出当前缓冲区内的文件

list file;

//删除缓存区内的指定file

delete file /root/test/sql;

create命令：创建自定义函数：hive> create temporary function udfTest as ‘com.cstore.udfExample’;

source <filepath>：在CLI中执行脚本文件。

//相当于[root@ncst test]# hive -S -f /root/test/sql

hive> source /root/test/sql;

! <command>：在CLI执行Linux命令。

dfs <dfs command>：在CLI执行hdfs命令

4.保存查询结果の三种方式：

% hive -S -e 'select * from dummy' > a.txt //分隔符和hive数据文件的分隔符相同

[root@hadoop01 ~]# hive -S -e "insert overwrite local directory '/root/hive/a'\

>  row format delimited fields terminated by '\t' --分隔符\t

>  select * from logs sort by te"

--使用hdfs命令导出整个表数据

hdfs dfs -get /hive/warehouse/hive01 /root/test/hive01

5.Hive集群间的导入和导出

使用Export命令会导出Hive表的数据表数据以及数据表对应的元数据

--导出命令

EXPORT TABLE test TO '/hive/test_export'

--dfs命令查看

hdfs dfs -ls /hive/test_export

--结果显示

/hive/test_export/_metadata

/hive/test_export/data

使用Import命令将导出的数据重新导入到hive中(必须将现导入的表重命名)

--导入到内部表的命令

IMPORT TABLE data_managed FROM '/hive/test_export'

--导入到外部表的命令

Import External Table data_external From '/hive/test_export' Location '/hive/external/data'

--验证是否是外部表

desc formatted data_external

6.Hive - JDBC/ODBC

在Hive的jar包中，"org.apache.hadoop.hive.jdbc.HiveDriver"负责提供 JDBC 接口，客户端程序有了这个包，就可以把 Hive 当成一个数据库来使用，大部分的操作与对传统数据库的操作相同，Hive 允许支持 JDBC 协议的应用程序连接到 Hive。当 Hive 在指定端口启动 hiveserver 服务后，客户端通过 Java 的 Thrift 和 Hive 服务器进行通信。过程如下：

　　1.开启 hiveserver 服务：$ hive –service hiveserver 50000（50000）

　　2.建立与 Hive 的连接：Class.forName(“org.apache.hadoop.hive.jdbc.HiveDriver”);

　　　　 Connection con= DriverManager.getConnection(“jdbc:hive://ip:50000/default,”hive”,”hadoop”)

　　　　默认只能连接到 default 数据库，通过上面的两行代码建立连接后，其他的操作与传统数据库无太大差别。

　　3.Hive 的 JDBC 驱动目前还不太成熟，并不支持所有的 JDBC API。

7.Hive Web Interface

　　1.配置hive-site.xml

        <property>

        <name>hive.hwi.war.file</name>

        <value>lib/hive-hwi-0.8.1.war</value>

        <description>This sets the path to the HWI war file, relative to ${HIVE_HOME}.</description>

        </property>

        <property>

        <name>hive.hwi.listen.host</name>

        <value>0.0.0.0</value>

        <description>This is the host address the Hive Web Interface will listen on</description>

        </property>

        <property>

        <name>hive.hwi.listen.port</name>

        <value>9999</value>

        <description>This is the port the Hive Web Interface will listen on</description>

        </property>

　　2.启动Hive的Web服务：hive --service hwi

　　3.在浏览器键入地址：http://host_name:9999/hwi访问

　　4.点击“Create Session”创建会话，在Query中键入查询语句

8. Hive创建数据库

hive启动后默认有一个Default数据库，也可以人为的新建数据库，命令：

--手动指定存储位置

create database hive02 location '/hive/hive02';

--添加其他信息(创建时间及数据库备注)

create database hive03 comment 'it is my first database' with dbproperties('creator'='kafka','date'='2015-08-08');

--查看数据库的详细信息

describe database hive03;

--更详细的查看

describe database extended hive03; 
--最优的查看数据库结构的命令

describe database formatted hive03;

--database只能修改dbproperties里面内容

alter database hive03 set dbproperties('edited-by'='hanmeimei');

Hive Shell常用操作的更多相关文章

【mongodb系统学习之八】mongodb shell常用操作
八.mongodb shell常用基础操作(每个语句后可以加分号,也可以不加,看情况定(有的工具中可以不加),最好是加): 1).进入shell操作界面:mongo,上边已有演示: 2).查看当前使 ...
二、hive shell常用命令
在使用hive shell之前我们需要先安装hive,并启动hdfs 请参考:https://www.cnblogs.com/lay2017/p/9973298.html hive shell 我们先 ...
Spark环境搭建（二）-----------HDFS shell 常用操作
配置好HDFS,也学习了点HDFS的简单操作,跟Linux命令相似 1) 配置Hadoop的环境变量,类似Java的配置在 ~/.bash_profile 中加入 export HADOOP_HO ...
hive的常用操作
1.hive的数据类型 tinyint/smallint/int/bigint tinyint:从 0 到 255 的整型数据 smallint:从 0 到 65535 的整型数据 int:从 0 到 ...
Hive基础之Hive表常用操作
本案例使用的数据均来源于Oracle自带的emp和dept表创建表语法: CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name ...
HIVE的常用操作（HQL)语句
HIVE基本操作命令创建数据库 >create database db_name; >create database if not exists db_name;//创建一个不存在的数据 ...
HBase基础之Hbase shell常用操作
一般操作查看服务器状态 status 查看hbase版本 version DDL操作创建表 create 'member','member_id','address','info' 创建了3个列族 ...
Linux Bash shell常用操作快捷键
转自:https://linuxtoy.org/archives/bash-shortcuts.html 生活在 Bash shell 中,熟记以下快捷键,将极大的提高你的命令行操作效率. 编辑命令 ...
Shell常用操作
1.读取配置文件中的jdbc_url参数的值($InputParamFile为待读取的目标文件绝对路径) jdbc_url=`grep "jdbc_url" $InputParam ...

随机推荐

TCL电视直播软件
升级你的电视系统我的型号46寸 V7300 3D,具体的升级程序在"技术宅"里有下载找个格式化过的U盘把你的程序拷贝进去,插在电视上,电视会自动升级当你成功安装V8-0MT32 ...
eclipse中设置在编译运行项目之前自动保存修改的文件
Window -> Preferences -> General -> Workspace -> “Save automatically before build” Windo ...
/dev/poll, kqueue(2), event ports, POSIX select(2), Windows select(), poll(2), and epoll(4)
/dev/poll, kqueue(2), event ports, POSIX select(2), Windows select(), poll(2), and epoll(4) libevent ...
Python overall structer
在C/C++/Java中,main是程序执行的起点,Python中,也有类似的运行机制,但方式却截然不同:Python使用缩进对齐组织代码的执行,所有没有缩进的代码(非函数定义和类定义),都会在载入时 ...
Solidworks to Urdf to Sdf
. The urdf using tree form that does not support parallel robots (close loop robots). . The sdf usin ...
Accuracy, Precision, Resolution & Sensitivity
Instrument manufacturers usually supply specifications for their equipment that define its accuracy, ...
Python进阶知识
装饰器迭代器生成器 mixins 元编程描述符量化领域常用列表推导式字典推导式高阶函数 lambda函数三目表达式
（2.6）Mysql之SQL基础——存储引擎的查看与修改
(2.6)Mysql之SQL基础——存储引擎的查看与修改可以使用 show engines; 查看数据库支持的所有的存储引擎: 目录: 1.数据库级别存储引擎 1.1查看现在默认的存储引擎 1.2 ...
bat批处理异备文件、压缩文件
1.压缩本地文件,并把压缩后的文件复制到其他机器 net use Z: \\192.168.135.1\share_linux a123456! /user:chaoqun.guo set bath= ...
mysql 数据库查询最后两条数据
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/u011925175/article/details/24186917 有一个mysql数据库的 ...

Hive Shell常用操作

Hive Shell常用操作的更多相关文章

随机推荐

热门专题