Apache Hive 建表操作的简单描述

客户端连接hive

[root@bigdata-02 bin]# ./beeline

Beeline version 1.2.1 by Apache Hive

beeline> ! connect jdbc:hive2://bigdata-01:10000

Connecting to jdbc:hive2://bigdata-01:10000

Enter username for jdbc:hive2://bigdata-01:10000: root

Enter password for jdbc:hive2://bigdata-01:10000: ******

Connected to: Apache Hive (version 1.2.1)

Driver: Hive JDBC (version 1.2.1)

Transaction isolation: TRANSACTION_REPEAtable_READ

0: jdbc:hive2://bigdata-01:10000>

create database hive_test;

show databases;

use hive_test;

创建表

create table t_a1(id int,name string) row format delimited fields terminated by ',';

加载数据  如果在本地加local  如果不在本地 不加local   load data只针对内部表

load data local inpath '/root/1.txt' into table t_a1

hadoop fs -put 1.txt /user/hive/warehouse/hive_test.db/t_a1  

1.txt

1,张学友

2,刘德华

3,黎明

4,郭富城

0: jdbc:hive2://bigdata-01:10000> select * from t_a1;

+----------+------------+--+

| t_a1.id  | t_a1.name  |

+----------+------------+--+

| 1        | 张学友        |

| 2        | 刘德华        |

| 3        | 黎明         |

| 4        | 郭富城        |

+----------+------------+--+

4 rows selected (1.358 seconds)

//创建外部表

create external table t_a2(id int,name string) row format delimited fields terminated by ',' location '/test/';

hadoop fs -mkdir /test

hadoop fs -put 1.txt /test

0: jdbc:hive2://bigdata-01:10000> select * from t_a2;

+----------+------------+--+

| t_a2.id  | t_a2.name  |

+----------+------------+--+

| 1        | 张学友        |

| 2        | 刘德华        |

| 3        | 黎明         |

| 4        | 郭富城        |

+----------+------------+--+

4 rows selected (0.638 seconds)

区别

内部表的数据文件必须放到 指定的位置

外部表的数据文件 可以自己指定位置

外部表 drop table t_a2 后 数据文件依然存在 内部表 直接连表带数据文件一起删除

//分区表

create table t_user(id int,name string,area string) partitioned by(region string) row format delimited fields terminated by ',';

//加载数据

 load data local inpath '/root/beijing.txt' into table t_user partition(region='beijing');

 load data local inpath '/root/shanghai.txt' into table t_user partition(region='shanghai');

0: jdbc:hive2://bigdata-01:10000> select * from t_user;

+----------+------------+------------+--------------+--+

| t_user.id  | t_user.name  | t_user.area  | t_user.region  |

+----------+------------+------------+--------------+--+

| 1        | 张学友        | 北京         | beijing      |

| 2        | 刘德华        | 北京         | beijing      |

| 3        | 黎明         | 北京         | beijing      |

| 4        | 郭富城        | 北京         | beijing      |

| 5        | 诸葛亮        | 上海         | shanghai     |

| 6        | 司马懿        | 上海         | shanghai     |

| 7        | 周瑜         | 上海         | shanghai     |

+----------+------------+------------+--------------+--+

7 rows selected (0.445 seconds)

//多分区

create table day_hour_table (id int, content string) partitioned by (dt string, hour string);

load data local inpath '/root/900101_08.txt' into table day_hour_table PARTITION(dt='1990-01-01', hour='');

//分桶表

开启分桶功能：set hive.enforce.bucketing = true;

设置reduce个数等于分桶的个数：set mapreduce.job.reduces=4;

创建表

create table stu_buck(Sno int,Sname string,Sex string,Sage int,Sdept string) clustered by(Sno) into 4 buckets row format delimited fields terminated by ',';

加载方式:

1,首先创建一个普通的过渡中间表 把对应的文件映射上去

create table student(Sno int,Sname string,Sex string,Sage int,Sdept string) row format delimited fields terminated by ',';

hadoop fs -put students.txt /user/hive/warehouse/hive_test.db/student

2,真正映射分桶表(insert+select)

insert overwrite table stu_buck select * from student cluster by(Sno);

测试的时候可以设置本地模式

set hive.exec.mode.local.auto=true;

Apache Hive 建表操作的简单描述的更多相关文章

[Hive_3] Hive 建表指定分隔符
0. 说明 Hive 建表示例及指定分隔符 1. Hive 建表 Demo 在 Hive 中输入以下命令创建表 user2 create table users2 (id int, name stri ...
Hive与表操作有关的语句
Hive与表操作有关的语句 1.创建表的语句: Create [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COM ...
hive建表与数据的导入导出
建表: create EXTERNAL table tabtext(IMSI string,MDN string,MEID string,NAI string,DestinationIP string ...
hive建表没使用LZO存储格式，可是数据是LZO格式时遇到的问题
今天微博大数据平台发邮件来说.他们有一个hql执行失败.可是从gateway上面的日志看不出来是什么原因导致的,我帮忙看了一下.最后找到了问题的解决办法,下面是分析过程: 1.执行失败的hql: IN ...
Oracle 自动生成hive建表语句
从 oracle 数据库导数到到 hive 大数据平台,需要按照大数据平台的数据规范,重新生成建表的 SQL 语句,方便其间,写了一个自动生成SQL的存储过程. ① 创建一张表,用来存储源表的结构,以 ...
CDH集群部署hive建表中文乱码
背景:部署CDH集群的 hive 服务,选用 mysql 作为 hive 元数据的存储数据库,通过 hive cli 建表时发现中文注释均乱码. 现象:hive端建表中文注释乱码. 定位: 已经确认过 ...
利用MySQL原数据信息批量转换指定库数据表生成Hive建表语句
1.写出文件工具类 package ccc.utile; import java.io.*; /** * @author ccc * @version 1.0.0 * @ClassName Write ...
hive建表范例
建表范例:支持update和delete create table aaa( id string, visitor_name string ) clustered by(id) into bucket ...
Hive建表和内外部表的使用
原文链接: https://www.toutiao.com/i6766784274965201415 一.普通建表方式 create table stu_info( id int, name stri ...

随机推荐

Mac安装并破解StarUML
1.下载与安装这里不做赘述,直接去官网下载即可 http://staruml.io/ 2.关键的事情来了,破解一.打开安装包的目录 cd /Applications/StarUML.app/Cont ...
从云主机上下载文件到本地+获取外网地址（linux & Windows）
云主机上下载有集中方法,腾讯论坛有一遍文章:向云服务器上传下载文件方法汇总货比三家,最终还是选择了rsync 下载代码如下 rsync ubuntu@123.207.251.217:/var/www ...
HDU - 6231：K-th Number （不错的二分）
Alice are given an array A[1..N]A[1..N] with NN numbers. Now Alice want to build an array BB by a pa ...
Windows操作系统及其安全机制
kali视频学习请看 http://www.cnblogs.com/lidong20179210/p/8909569.html Windows操作系统及其安全机制 Windows文件系统 FAT (F ...
(转)用Eclipse 统计代码行数小技巧
今天公司SQA问我目前项目代码行数有多少,我当时就是想,以前好像写过类似的统计工具但是一时又找不到公司网络又不能下载,所以想想eclipse是不是又类似功能,找了下没有,但突然一想有一个转弯方法:统 ...
Eclipse中的maven项目打war包
在对应的pom文件中,找到packing这个属性,改为war:如果没有,就自己加一个,这个是有默认值的,默认为jar. 例如: <modelVersion>4.0.0</modelV ...
(转)Apache转发配置
本文转载自:http://blog.csdn.net/leshjmail/article/details/6163581 安装文件 1.httpd-2.2.15-win32-x86-no_ssl.ms ...
java图形用户界面边界布局管理器
总结:不同方向的组件,所用的板是不同的: package com.moc; //用布局写一个界面 ///运用边界布局 //2个按钮在北,2个按钮在南 //中央一个大按钮 //将同一方向的组件封装后布局 ...
Tair ldb（leveldb存储引擎）实现介绍
简介 tair 是淘宝自己开发的一个分布式 key/value 存储引擎. tair 分为持久化和非持久化两种使用方式. 非持久化的 tair 可以看成是一个分布式缓存. 持久化的 tair 将数据存 ...
AngularJS：教程
ylbtech-AngularJS:教程 1.返回顶部 1. AngularJS 教程 AngularJS 通过新的属性和表达式扩展了 HTML. AngularJS 可以构建一个单一页面应用程序(S ...

Apache Hive 建表操作的简单描述

Apache Hive 建表操作的简单描述的更多相关文章

随机推荐

热门专题