1. Hive默认显示当前使用库

 、需要用时，即时配置，在cli执行属性设置，这种配置方式，当重新打开cli时，就会生效：

 hive> set hive.cli.print.current.db=true;

 、一次配置，永久生效，在当前用户的HOME目录下，新建.hiverc文件，把属性设置命令放置到该文件中，每次打开cli时，都会先执行该文件。

 [yun@mini01 ~]$ pwd

 /app

 [yun@mini01 ~]$ cat .hiverc

 set hive.cli.print.current.db=true;

 、在hive配置文件中添加配置【推荐】,上一篇文章hive配置中已经有了该配置项

   <!-- 显示当前使用的数据库 -->

   <property>

     <name>hive.cli.print.current.db</name>

     <value>true</value>

     <description>Whether to include the current database in the Hive prompt.</description>

   </property>

2. 创建库

 # 没有显示当前使用库

 [yun@mini01 ~]$ hive

 Logging initialized using configuration in jar:file:/app/hive-1.2./lib/hive-common-1.2..jar!/hive-log4j.properties

 hive> show databases;  # 默认库为default

 OK

 default

 Time taken: 0.774 seconds, Fetched:  row(s)

 # 创建库

 hive> create database zhang;

 OK

 Time taken: 0.168 seconds

 hive> show databases;

 OK

 default

 zhang

 Time taken: 0.02 seconds, Fetched:  row(s)

浏览器访问

3. 创建表

 # 默认显示当前使用库

 hive (default)> show databases;

 OK

 default

 zhang

 Time taken: 0.729 seconds, Fetched:  row(s)

 hive (default)> use zhang;

 OK

 Time taken: 0.036 seconds

 hive (zhang)> create table t_sz01(id int, name string)

             > row format delimited

             > fields terminated by ',';

 OK

 Time taken: 0.187 seconds

 hive (zhang)> show tables;

 OK

 t_sz01

 Time taken: 0.031 seconds, Fetched:  row(s)

浏览器访问

4. 创建数据并上传

 [yun@mini01 hive]$ cat sz.dat

 ,zhangsan

 ,李四

 ,wangwu

 ,赵六

 ,zhouqi

 ,孙八

 [yun@mini01 hive]$ hadoop fs -put sz.dat /user/hive/warehouse/zhang.db/t_sz01   # 上传

 [yun@mini01 hive]$ hadoop fs -ls /user/hive/warehouse/zhang.db/t_sz01/

 Found  items

 -rw-r--r--    yun supergroup          -- : /user/hive/warehouse/zhang.db/t_sz01/sz.dat

 [yun@mini01 hive]$ hadoop fs -cat /user/hive/warehouse/zhang.db/t_sz01/sz.dat

 ,zhangsan

 ,李四

 ,wangwu

 ,赵六

 ,zhouqi

 ,孙八

5. Hive查询数据

 hive (zhang)> show tables;

 OK

 t_sz01

 Time taken: 0.028 seconds, Fetched:  row(s)

 hive (zhang)> select * from t_sz01;  # 全表查询

 OK

     zhangsan

     李四

     wangwu

     赵六

     zhouqi

     孙八

 Time taken: 0.264 seconds, Fetched:  row(s)

 hive (zhang)> select count() from t_sz01;  # 表数据条数

 Query ID = yun_20180703213443_ebca743c--405a--59359e1566c2

 Total jobs =

 Launching Job  out of

 Number of reduce tasks determined at compile time:

 In order to change the average load for a reducer (in bytes):

   set hive.exec.reducers.bytes.per.reducer=<number>

 In order to limit the maximum number of reducers:

   set hive.exec.reducers.max=<number>

 In order to set a constant number of reducers:

   set mapreduce.job.reduces=<number>

 Starting Job = job_1530619476293_0001, Tracking URL = http://mini02:8088/proxy/application_1530619476293_0001/

 Kill Command = /app/hadoop/bin/hadoop job  -kill job_1530619476293_0001

 Hadoop job information for Stage-: number of mappers: ; number of reducers:

 -- ::, Stage- map = %,  reduce = %

 -- ::, Stage- map = %,  reduce = %, Cumulative CPU 2.5 sec

 -- ::, Stage- map = %,  reduce = %, Cumulative CPU 6.37 sec

 MapReduce Total cumulative CPU time:  seconds  msec

 Ended Job = job_1530619476293_0001

 MapReduce Jobs Launched:

 Stage-Stage-: Map:   Reduce:    Cumulative CPU: 6.37 sec   HDFS Read:  HDFS Write:  SUCCESS

 Total MapReduce CPU Time Spent:  seconds  msec

 OK

 Time taken: 25.312 seconds, Fetched:  row(s)

 hive (zhang)> select id,name from t_sz01 where id >;  # 查询id>

 OK

     李四

     zhouqi

     孙八

 Time taken: 0.126 seconds, Fetched:  row(s)

 hive (zhang)> select id,name from t_sz01 where id > limit ;  # 不能使用 limit m,n

 OK

     李四

     zhouqi

 Time taken: 0.072 seconds, Fetched:  row(s)

 hive (zhang)> select id, name from t_sz01 order by name;  # 使用order by 排序

 Query ID = yun_20180703214314_db222afe--4c8e--73aa4fec62ef

 Total jobs =

 Launching Job  out of

 Number of reduce tasks determined at compile time:

 In order to change the average load for a reducer (in bytes):

   set hive.exec.reducers.bytes.per.reducer=<number>

 In order to limit the maximum number of reducers:

   set hive.exec.reducers.max=<number>

 In order to set a constant number of reducers:

   set mapreduce.job.reduces=<number>

 Starting Job = job_1530619476293_0002, Tracking URL = http://mini02:8088/proxy/application_1530619476293_0002/

 Kill Command = /app/hadoop/bin/hadoop job  -kill job_1530619476293_0002

 Hadoop job information for Stage-: number of mappers: ; number of reducers:

 -- ::, Stage- map = %,  reduce = %

 -- ::, Stage- map = %,  reduce = %, Cumulative CPU 2.64 sec

 -- ::, Stage- map = %,  reduce = %, Cumulative CPU 4.85 sec

 MapReduce Total cumulative CPU time:  seconds  msec

 Ended Job = job_1530619476293_0002

 MapReduce Jobs Launched:

 Stage-Stage-: Map:   Reduce:    Cumulative CPU: 4.85 sec   HDFS Read:  HDFS Write:  SUCCESS

 Total MapReduce CPU Time Spent:  seconds  msec

 OK

     wangwu

     zhangsan

     zhouqi

     孙八

     李四

     赵六

 Time taken: 26.768 seconds, Fetched:  row(s)

MapReduce信息

 http://mini02:8088

6. Hive的访问方式

6.1. Hive交互shell

 # 之间已经添加环境变量

 [yun@mini01 ~]$ hive

6.2. Hive thrift服务

　　启动方式，（例如是在mini01上）：

 # 之间已经添加环境变量

 启动为前台： hiveserver2

 启动为后台： nohup hiveserver2 >/app/hive/logs/hiveserver.log >/app/hive/logs/hiveserver.err &

 # 没有 /app/hive/logs 目录就创建

　　启动成功后，可以在别的节点上用beeline去连接

方式1

 # 由于没有在其他机器安装，所以还是在本机用beeline去连接

 [yun@mini01 bin]$ beeline

 Beeline version 1.2. by Apache Hive

 beeline> !connect jdbc:hive2://mini01:10000   # jdbc连接 可以是mini01、127.0.0.0、10.0.0.11、172.16.1.11

 Connecting to jdbc:hive2://mini01:10000

 Enter username for jdbc:hive2://mini01:10000: yun

 Enter password for jdbc:hive2://mini01:10000:

 Connected to: Apache Hive (version 1.2.)

 Driver: Hive JDBC (version 1.2.)

 Transaction isolation: TRANSACTION_REPEATABLE_READ

 : jdbc:hive2://mini01:10000>

方式2

 # 或者启动就连接：

 [yun@mini01 ~]$ beeline -u jdbc:hive2://mini01:10000 -n yun

接下来就可以做正常sql查询了

例如：

 : jdbc:hive2://mini01:10000> show databases;

 +----------------+--+

 | database_name  |

 +----------------+--+

 | default        |

 | zhang          |

 +----------------+--+

  rows selected (0.437 seconds)

 : jdbc:hive2://mini01:10000> use zhang;

 No rows affected (0.058 seconds)

 : jdbc:hive2://mini01:10000> show tables;

 +-----------+--+

 | tab_name  |

 +-----------+--+

 | t_sz01    |

 +-----------+--+

  row selected (0.054 seconds)

 : jdbc:hive2://mini01:10000> select * from t_sz01;

 +------------+--------------+--+

 | t_sz01.id  | t_sz01.name  |

 +------------+--------------+--+

 |           | zhangsan     |

 |           | 李四         |

 |           | wangwu       |

 |           | 赵六         |

 |           | zhouqi       |

 |           | 孙八         |

 +------------+--------------+--+

  rows selected (0.641 seconds)

 : jdbc:hive2://10.0.0.11:10000> select count(1) from t_sz01;  # 条数查询

 INFO  : Number of reduce tasks determined at compile time:

 INFO  : In order to change the average load for a reducer (in bytes):

 INFO  :   set hive.exec.reducers.bytes.per.reducer=<number>

 INFO  : In order to limit the maximum number of reducers:

 INFO  :   set hive.exec.reducers.max=<number>

 INFO  : In order to set a constant number of reducers:

 INFO  :   set mapreduce.job.reduces=<number>

 INFO  : number of splits:

 INFO  : Submitting tokens for job: job_1530619476293_0003

 INFO  : The url to track the job: http://mini02:8088/proxy/application_1530619476293_0003/

 INFO  : Starting Job = job_1530619476293_0003, Tracking URL = http://mini02:8088/proxy/application_1530619476293_0003/

 INFO  : Kill Command = /app/hadoop/bin/hadoop job  -kill job_1530619476293_0003

 INFO  : Hadoop job information for Stage-: number of mappers: ; number of reducers:

 INFO  : -- ::, Stage- map = %,  reduce = %

 INFO  : -- ::, Stage- map = %,  reduce = %, Cumulative CPU 2.56 sec

 INFO  : -- ::, Stage- map = %,  reduce = %, Cumulative CPU 5.28 sec

 INFO  : MapReduce Total cumulative CPU time:  seconds  msec

 INFO  : Ended Job = job_1530619476293_0003

 +------+--+

 | _c0  |

 +------+--+

 |     |

 +------+--+

  row selected (25.433 seconds)

6.3. hive -e "HiveQL"

适用于写脚本

 [yun@mini01 ~]$ hive -e "use exercise; select * from student;"

 Logging initialized using configuration in jar:file:/app/hive-1.2./lib/hive-common-1.2..jar!/hive-log4j.properties

 OK

 Time taken: 1.109 seconds

 OK

     李勇    男        CS

     刘晨    女        IS

     王敏    女        MA

     张立    男        IS

     刘刚    男        MA

     孙庆    男        CS

     易思玲    女        MA

     李娜    女        CS

     梦圆圆    女        MA

     孔小涛    男        CS

 Time taken: 0.786 seconds, Fetched:  row(s)

6.4. hive -f 'test.sql'

　　适用于hive直接调用一个脚本，该脚本中全是hive的类SQL语句。

 # aztest.sql  脚本名称

 CREATE DATABASE IF NOT EXISTS azkaban;

 use azkaban;

 DROP TABLE IF EXISTS aztest;

 DROP TABLE IF EXISTS azres;

 create table aztest(id int,name string) row format delimited fields terminated by ',';

 load data inpath '/aztest/hiveinput/azkb.dat' into table aztest;

 create table azres row format delimited fields terminated by '#' as select * from aztest;

 insert overwrite directory '/aztest/hiveoutput' select count(1) from aztest;

7. 文章参考

1、Hive创建表格报【Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask.

2、实战 - Hive cli命令行工具默认显示当前数据库

Hive-1.2.1_02_简单操作与访问方式的更多相关文章

简单操作：10分钟实现在kubernetes(k8s)里面部署服务器集群并访问项目（docker三）
前言经过docker安装.k8s开启并登录,我们终于到 "部署k8s服务器集群并访问项目" 这一步了,实现的过程中有太多坑,好在都填平了,普天同庆. 在进行当前课题之前,我们需要 ...
Hive的基本知识与操作
Hive的基本知识与操作目录 Hive的基本知识与操作 Hive的基本概念为什么使用Hive? Hive的特点: Hive的优缺点: Hive应用场景 Hive架构 Client Metastor ...
python（pymysql）之mysql简单操作
一.mysql简单介绍说到数据库,我们大多想到的是关系型数据库,比如mysql.oracle.sqlserver等等,这些数据库软件在windows上安装都非常的方便,在Linux上如果要安装数据库 ...
C# Asp.net中简单操作MongoDB数据库（一）
需要引用MongoDB.Driver.dll.MongoDB.Driver.core.dll.MongoDB.Bson.dll三个dll. 1.数据库连接: public class MongoDb ...
二叉树的简单操作（Binary Tree）
树形结构应该是贯穿整个数据结构的一个比较重要的一种结构,它的重要性不言而喻! 讲到树!一般都是讨论二叉树,而关于二叉树的定义以及概念这里不做陈诉,可自行搜索. 在C语言里面需要实现一个二叉树,我们需要 ...
MongoDB数据库简单操作
之前学过的有mysql数据库,现在我们学习一种非关系型数据库一.简介 MongoDB是一款强大.灵活.且易于扩展的通用型数据库 MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数 ...
【ZooKeeper】ZooKeeper安装及简单操作
ZooKeeper介绍 ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件.它是一个为分布式应用提供一 ...
MySQL基本概念以及简单操作
一.MySQL MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于Oracle 旗下产品.MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MyS ...
HDFS介绍及简单操作
目录 1.HDFS是什么? 2.HDFS设计基础与目标 3.HDFS体系结构 3.1 NameNode(NN)3.2 DataNode(DN)3.3 SecondaryNameNode(SNN)3.4 ...

随机推荐

Linux_CentOS-服务器搭建 <七>
设置Linux下Mysql表名不区分大小写对linux安装mysql不熟悉的(查看我那一系列的文章第一篇): http://www.cnblogs.com/Alandre/p/3365535.htm ...
从零开始学 Web 之 jQuery（七）事件冒泡，事件参数对象，链式编程原理
大家好,这里是「从零开始学 Web 系列教程」,并在下列地址同步更新...... github:https://github.com/Daotin/Web 微信公众号:Web前端之巅博客园:ht ...
vue 动态组件、父子组件传参
1.vue中的自定义属性并获得属性的值自定义属性::data-id语法为 :data-属性获取属性的值:ev.target.dataset.id 2.vue父子组件传值 3.动态组件使用
ASP.NET MVC 5 Authentication Breakdown
In my previous post, "ASP.NET MVC 5 Authentication Breakdown", I broke down all the parts ...
virtualBox安装centos，并搭建tomcat
前言本文没什么难点,只是发现自己记忆不好,特别是搭建tomcat服务的时候,总是需要去重新查阅资料,特此就写这篇博客来加强自己的记忆,同时也给大家以参考: 路漫漫其修远兮,吾将上下而求索! gith ...
再会，OI
现在时间是一八年的七月二十一日下午,NOI2018 闭幕式已经结束.嗯,结束了... 谢绝了李总的好意也没有让父母来接,有段路还是要自己一个人走的... 总结一下 NOI ...其实也没有什么好总结的 ...
.net项目技术选型总结
做.net开发已经几年了,也参与开发了很多大大小小的项目,所以现在希望总结出一套开发.net项目的常用技术,也为以后做项目技术选型的时候作为参考. 数据库小型项目:SQLite(工具) 中大型项目: ...
.8-浅析webpack源码之Tapable介绍
Tapable工具完成webpack默认参数注入后,下一步虽然是 new Compiler() ,但是这东西不是一下可以讲完的,复杂的一批. 不如先从工具入手,分块讲解compiler,首先来看看事 ...
漫画 | Servlet属于线程安全的吗？
Servlet属于线程安全的吗? Servlet不是线程安全的在JSP中,只有一行代码:<%=A+B %>,运行结果如何? jsp和servlet有什么关系? jsp一般被用在view层 ...
regular.js
//手机号验证 var regMobile=/^1[3,5,8]\d{9}$/; //固定电话 var regPhone=/^(^0\d{2}-?\d{8}$)|(^0\d{3}-?\d{7}$)|( ...

Hive-1.2.1_02_简单操作与访问方式

1. Hive默认显示当前使用库

2. 创建库

3. 创建表

4. 创建数据并上传

5. Hive查询数据

6. Hive的访问方式

6.1. Hive交互shell

6.2. Hive thrift服务

6.3. hive -e "HiveQL"

6.4. hive -f 'test.sql'

7. 文章参考

Hive-1.2.1_02_简单操作与访问方式的更多相关文章

随机推荐

热门专题