hive实践

本地一份包含有中文的文本文件在上传到hive前，需要先转化为UTF-8格式，否则会出现乱码。(notepad++ 格式>>>转化UTF-8编码格式)

--------------------------------------------------------------------------------------------------不带分区----------------------------------------------------------------------------------------------------------

不带分区的表创建：(换行符\n做行分割，制表符\t做列分割)

drop table if exists SCAN.ZTO_SCAN_COME_TEST_WL;

create table SCAN.ZTO_SCAN_COME_TEST_WL

(

USERNAME string,

USERID string

)

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' STORED AS TEXTFILE;

删除表数据： insert overwrite table ZTO_SCAN_COME_TEST_WL select * from ZTO_SCAN_COME_TEST_WL where 1=0;

全量导入数据方式一：覆盖

insert overwrite table ZTO_SCAN_COME_TEST_WL

select '李磊' as username,'1006' as userid from ZTO_SCAN_COME_MANSUM limit 1

全量导入数据方式二：覆盖

load data inpath '/user/hive/HQL_SOURCE/date_test_one.txt'

overwrite into table ZTO_SCAN_COME_TEST_WL

增量导入数据方式一：添加

insert into table ZTO_SCAN_COME_TEST_WL

select '李磊1' as username,'1007' as userid from ZTO_SCAN_COME_TEST_WL limit 1

增量导入数据方式二：添加

load data inpath '/user/hive/HQL_SOURCE/date_test_one.txt'

into table ZTO_SCAN_COME_TEST_WL

--------------------------------------------------------------------------------------------------带分区----------------------------------------------------------------------------------------------------------------

带分区的表创建：(换行符\n做行分割，制表符\t做列分割)

drop table if exists SCAN.ZTO_SCAN_COME_TEST_WL;

create table SCAN.ZTO_SCAN_COME_TEST_WL

(

USERNAME string,

USERID string

)

partitioned by(ds1 string,ds2 string)

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' STORED AS TEXTFILE;

删除某个分区数据：

ALTER TABLE ZTO_SCAN_COME_TEST_WL DROP IF EXISTS PARTITION (ds2='南京');

ALTER TABLE ZTO_SCAN_COME_TEST_WL DROP IF EXISTS PARTITION (ds1='20160902');

alter table ZTO_SCAN_COME_TEST_WL drop if exists partition(ds1='20160902',ds2='北京');

注意：

1、带有分区的表数据插入时，必须指定到每个分区，一个不能少

2、带有分区的表数据删除时，至少指定一个分区即可

全量导入数据方式一：覆盖

insert overwrite table ZTO_SCAN_COME_TEST_WL partition (ds1='20160901',ds2='上海')

select '李磊' as username,'1006' as userid from ZTO_SCAN_COME_MANSUM limit 1;

insert overwrite table ZTO_SCAN_COME_TEST_WL partition (ds1='20160901',ds2='南京')

select '李磊' as username,'1007' as userid from ZTO_SCAN_COME_MANSUM limit 1;

全量导入数据方式二：覆盖

load data inpath '/user/hive/HQL_SOURCE/date_test_one.txt'

overwrite into table ZTO_SCAN_COME_TEST_WL partition (ds1='20160902',ds2='南京')

load data inpath '/user/hive/HQL_SOURCE/date_test_one.txt'

overwrite into table ZTO_SCAN_COME_TEST_WL partition (ds1='20160902',ds2='泰州')

增量导入方式一：添加

insert into table ZTO_SCAN_COME_TEST_WL partition (ds1='20160901',ds2='上海')

select '李磊' as username,'1006' as userid from ZTO_SCAN_COME_MANSUM limit 1;

增量导入方式二：添加

load data inpath '/user/hive/HQL_SOURCE/date_test_one.txt'

into table ZTO_SCAN_COME_TEST_WL partition (ds1='20160902',ds2='南京')

hive实践_01的更多相关文章

达观数据分析平台架构和Hive实践——TODO
转自: http://www.infoq.com/cn/articles/hadoop-ten-years-part03 编者按:Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对 ...
Hive实践（hive0.12）
版本号:cdh5.0.0+hadoop2.3.0+hive0.12 一.原始数据: 1. 本地数据 [root@node33 data]# ll total 12936 -rw-r--r--. 1 r ...
hive学习_01
1.构建在Hadoop之上的数据仓库(数据计算使用MR,数据存储使用HDFS) 2.Hive定义了一种类SQL查询语言----HQL 3.通常用于进行离线数据处理(非实时) 4.一个ETL工具 5.可 ...
DEVOPS技术实践_01:jenkins集成平台
一.准备环境准备三台机器角色 IP地址用户名密码 jenkins-master 172.25.254.130 admin meiyoumima gitlab 172.25.254 ...
Hadoop生态系统—数据仓库Hive的安装
一.数据仓库数据仓库是一个面向主题的.集成的.随时间变化,但信息本身相对稳定的数据集合,相比于传统型数据库,它主要用于支持企业或组织的决策分析处理.主要有以下3个特点: 数据仓库是面向主题的: 数据 ...
Impala 笔记
简介 Cloudera公司推出,提供对HDFS.Hbase数据的高性能.低延迟的交互式SQL查询功能. 基于Hive使用内存计算,兼顾数据仓库.具有实时.批处理.多并发等优点是CDH平台首选的PB级 ...
【转】Kylin实践之使用Hive视图
http://blog.csdn.net/yu616568/article/details/50548967 为什么需要使用视图 Kylin在使用的过程中使用hive作为cube的输入,但是有些情况下 ...
hive权限管理之实践
一.实践心得主要参考这个连接,里面说得也挺详细的.http://www.aboutyun.com/thread-12549-1-1.html 总结如下: 1.若赋予用户某个表的权限,查用户在该表所属 ...
ETL实践--kettle转到hive
ETL实践--kettle只做源数据的抽取,其他数据转换转到hive上. 1.用hive代替kettle的数据关联的原因 (1).公司之前的数据ELT大量使用了kettle.用kettle导原始数据速 ...

随机推荐

python的拆包（扫盲）
什么是拆包拆包: 对于函数中的多个返回数据, 去掉元组, 列表或者字典直接获取里面数据的过程. 怎么拆包 1) 对列表进行拆包 my_list = [1, 3.14, "hello&q ...
fetch API 和 ajax
fetch('/some.json', { method: 'get', body: { id: 22 } }).then(function (resp) { resp.json().then(con ...
EL表达式详细教程
EL 全名为Expression Language EL 语法很简单,它最大的特点就是使用上很方便.接下来介绍EL主要的语法结构: ${sessionScope.user.sex} 所有EL都是以${ ...
我在linux的第一个C程序
今天在虚拟机装起了linux,根据大家学习所需要,可以安装自己喜欢的版本,我这里装的是centos 7.0版本,也正是学习的开始,现在来看看简洁大气的centos界面吧: 在centos编译C ...
Flume 实战练习
前期准备了解Flume 架构及核心组件 Flume 架构及核心组件 Source : 收集(指定数据源从哪里获取) Channel : 聚集 Sink : 输出(把数据写到哪里去) 学习使用 Flu ...
2018 ACM 国际大学生程序设计竞赛上海大都会赛
传送门:2018 ACM 国际大学生程序设计竞赛上海大都会赛 2018 ACM 国际大学生程序设计竞赛上海大都会赛重现赛2018-08-05 12:00:00 至 2018-08-05 17:00:0 ...
SecureCRT语法高亮设置
因为默认情况下,SecureCRT不能显示语法高亮特性,整个界面颜色单一,看起来不爽,也没有效率,所有通过设置一下语法高亮还是很有必要的, 默认字体也看着不是很清晰,还是更改为我比较喜欢的Courie ...
selenium+requests进行cookies保存读取操作
看这篇文章之前大家可以先看下我的上一篇文章:cookies详解本篇我们就针对上一篇来说一下cookies的基本应用使用selenium模拟登陆百度 from selenium import web ...
[开源福利] Arithmetic Generator
Arithmetic Generator Built with ❤︎ by Simon Ma ✨ A powerful arithmetic generator
使用Lucene.Net做一个简单的搜索引擎-全文索引
Lucene.Net Lucene.net是Lucene的.net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎. ...

hive实践_01

hive实践_01的更多相关文章

随机推荐

热门专题