hive 之 常用基本操作
show databases; -- 查看所有数据库 use 数据库; -- 进入某个数据库 select current_database(); -- 查看当前使用的数据库 show tables; -- 显示所有表 show tables like '*tb_site*' -- 显示特定表 show partitions 表名; -- 显示表的所有分区 desc tab_name; -- 查看表结构 desc formatted tab_name; -- 查看表结构详细信息(文件地址) 查看表在HDFS中存放的数据文件(hadoop操作):
hdfs dfs -ls hdfs://hadoop001:8020/user/hive/warehouse/tab_name(文件地址) show create table_name; -- 显示创建表的语句 select * from tab_name limit 2; -- 查询前n行 创建分区表:
create table if not exists tab_name(
id int,
name string
)PARTITIONED BY (deal_day string) -- deal_day 分区字段
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\u0001' -- 分隔符
LINES TERMINATED BY '\n' -- 换行符
STORED AS TEXTFILE -- 数据存储格式
LOCATION '/data/tab_name' -- 文件存储地址 create table as select 指定数据存储格式创建表 create table tab_name stored as textfile as
select * from tab_name2 insert overwrite table 覆盖分区式插入数据
注:在表结构发生变化(增加、删除字段)之后,需要删除分区才能更新数据。 insert overwrite table tab_name partition(deal_day='某个分区日期')
select * from tab_name2 自动分区插入数据
insert overwrite table tab_name partition(deal_day)
select id,name,deal_day from tab_name2 alter table table_name rename to new_table_name; -- 重命名表 alter table table_name add columns (newcol1 int comment '备注信息,可忽略'); -- 增加字段 alter table table_name change col_name new_col_name new_type;-- 修改字段 alter table table_name replace columns (col1 int,col2 string,col3 string);-- 删除字段(COLUMNS中只放保留的字段) drop table table_name;-- 删除表 alter table table_name drop if exists partition (deal_day='某个分区日期'); -- 删除分区 drop database if exists db_name; -- 删除库 drop database if exists db_name cascade; -- 强制删除库 drop table if exists table_name; -- 删除表 truncate table table_name; -- 清空表 insert overwrite table table_name select * from table_name where 1=0; -- 清空表 alter table table_name drop partition (deal_day<='某个日期'); -- 删除分区 insert overwrite table table_name select * from table_name where id>='20'; -- 按条件删除数据,删除id小于20的数据,保留id大于等于20的数据 hive -e "sql语句" -- 将查询结果打印在控制台上 hive -e "sql语句" > xxx.txt -- 将查询结果写入到txt文件中
hive 之 常用基本操作的更多相关文章
- 2 hive的使用 + hive的常用语法
本博文的主要内容有: .hive的常用语法 .内部表 .外部表 .内部表,被drop掉,会发生什么? .外部表,被drop掉,会发生什么? .内部表和外部表的,保存的路径在哪? .用于创建一些临时表存 ...
- MatplotLib常用基本操作
本文记录matlibplot常用基本操作,都是基本功能,不涉及复杂联合操作,其中各用法详细用法可参考官网: 1. 基本画图操作 ##mofan_matplotlib.pyplot import mat ...
- Hive SQL 常用日期
Hive SQL 常用日期 原文地址:Hive SQL常用日期函数 Hive SQL 常用日期 注意: MM DD MO TU等要大写 已知日期 要求日期 语句 结果 本周任意一天 本周一 selec ...
- hive的使用 + hive的常用语法
本博文的主要内容有: .hive的常用语法 .内部表 .外部表 .内部表,被drop掉,会发生什么? .外部表,被drop掉,会发生什么? .内部表和外部表的,保存的路径在哪? .用于创建一些临时表存 ...
- hive sql常用整理-hive引擎设置
遇到个情况,跑hive级联insert数据报错,可以尝试换个hive计算引擎 hive遇到FAILED: Execution Error, return code 2 from org.apache. ...
- hive的常用操作
1.hive的数据类型 tinyint/smallint/int/bigint tinyint:从 0 到 255 的整型数据 smallint:从 0 到 65535 的整型数据 int:从 0 到 ...
- hive & hive beeline常用参数
Hive 1参数如下: usage: hive -d,--define <key=value> Variable substitution to apply to Hive command ...
- 二、hive shell常用命令
在使用hive shell之前我们需要先安装hive,并启动hdfs 请参考:https://www.cnblogs.com/lay2017/p/9973298.html hive shell 我们先 ...
- Hive Shell常用操作
1.Hive非交互模式常用命令: 1) hive -e:从命令行执行指定的HQL,不需要分号: % hive -e 'select * from dummy' > a.txt 2) hive – ...
随机推荐
- TCP协议三步挥手与四步挥手
关于TCP协议 TCP(Transmission Control Protocol, 传输控制协议)是一种面向连接的.可靠的.基于字节流的传输层通信协议.与之对应的是UDP(User Datagram ...
- 使用Booststrap布局网页页面
<!DOCTYPE html><html lang="zh-CN"><head> <meta charset="utf-8&qu ...
- EFK的安装和收集docker容器日志展示
在用户根目录创建个filebeat.docker.yml文件,文件内容如下 filebeat.config: modules: path: ${path.config}/modules.d/*.yml ...
- 『学了就忘』Linux服务管理 — 77、RPM包安装基于xinetd的服务的管理
目录 1.基于xinetd服务的启动管理 (1)telnet服务安装 (2)telnet服务启动 2.基于xientd服务的自启动管理 现在Linux系统中基于xinetd的服务越来越少了,但Linu ...
- Nginx安全检查
1.检查是否配置Nginx账号锁定策略 描述 1.执行系统命令passwd -S nginx来查看锁定状态 出现Password locked证明锁定成功 如:nginx LK ..... (Pass ...
- malloc实现
任何一个用过或学过C的人对malloc都不会陌生.大家都知道malloc可以分配一段连续的内存空间,并且在不再使用时可以通过free释放 掉.但是,许多程序员对malloc背后的事情并不熟悉,许多人甚 ...
- 资源的批量删除与替换(Project)
<Project2016 企业项目管理实践>张会斌 董方好 编著 资源分配好以后,嗯,很满意! 可是!有人看了不满意,或者自己手贱分配错了,要改? 改就改呗,和分配有什么区别吗? 没有啊! ...
- 联盛德 HLK-W806 (十一): 软件SPI和硬件SPI驱动ST7567液晶LCD
目录 联盛德 HLK-W806 (一): Ubuntu20.04下的开发环境配置, 编译和烧录说明 联盛德 HLK-W806 (二): Win10下的开发环境配置, 编译和烧录说明 联盛德 HLK-W ...
- VirtualBox 同时添加 NAT 和 Host-Only 网卡出现无法上网的情况
如果网卡1是 NAT,网卡2是 Host-Only,可以 ping 通 baidu.com. 如果网卡1是 Host-Only,网卡2是 NAT,无法 ping 通 baidu.com. 使用 nmc ...
- 快速上手FastJSON
前言 作为一名后端开发而言肯定会接触数据,把数据提供给前端或者把数据存储起来,目前比较火热的传输格式是json,给前端传json是再常见不过啦,甚至是往db里面直接存入json. 在java层面来说j ...