[Hive_4] Hive 插入数据

0. 说明

　　Hive 插入数据的方法 && Hive 插入数据的顺序 && 插入复杂数据的方法 && load 命令详解

1. Hive 插入数据的方法

　　Hive 插入数据不是使用 insert，而是 load

2. Hive 插入数据的顺序

　　2.1 先定义好表结构

create table employee(name string,

work_place array<string>,

sex_age struct<sex:string, age:int>,

score map<string, int>,

depart_title map<string, string>)

row format delimited

fields terminated by '|'

collection items terminated by ','

map keys terminated by ':'

lines terminated by '\n'

stored as textfile;

　　2.2 准备数据。数据格式要和表结构对应 employee.txt

Michael|Montreal,Toronto|Male,30|DB:80|Product:Developer

Will|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead

Shelley|New York|Female,27|Python:80|Test:Lead,COE:Architect

Lucy|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead

　　2.3 空表中使用 load 命令加载数据

load data local inpath '/home/centos/files/employee.txt' into table employee;

　　2.4 取出所有的成员

# array获取

select name ,work_place[] from employee;

# 结构体获取

select name ,sex_age.sex from employee;

# map成员获取

select name, score['Python'] from employee;

3. 插入复杂类型数据 insert

　　3.0 设置显示表头

　　临时修改命令如下，永久修改需要修改配置文件 hive-site.xml

set hive.cli.print.header=true;

　　3.1 插入复杂类型使用转储

insert xxx select xxx

　　通过 select 语句构造出 array 类型

# 通过 select 语句构造出 array 类型

select array('tom','tomas','tomson') ;

# 转储 array 类型数据

insert into employee(name,work_place) select 'tom',array('beijing','shanghai','guangzhou');

　　通过 select 语句构造出 map 类型

# 通过 select 语句构造出 map 类型

select map('bigdata',100);

# 转储 map 类型数据

insert into employee(name,score) select 'tomas', map('bigdata',100);

　　通过 select 语句构造出 struct 类型

# 通过 select 语句构造出 struct 类型

select struct('male',10);

select named_struct('sex','male','age',10);

# 转储 struct 类型数据

insert into employee(name,sex_age) select 'tomson',named_struct('sex','male','age',10);

4. load命令详解

　　4.0 前提：先建表

create table duowan(id int, name string, pass string, mail string, nickname string)

row format delimited

fields terminated by '\t'

lines terminated by '\n'

stored as textfile;

　　4.1 使用 load

# load 本地数据,相当于上传或者复制，源文件不变

load data local inpath '/home/centos/files/employee.txt' into table employee;

# load hdfs 数据,相当于移动

load data inpath '/duowan_user.txt' into table duowan;

# load 本地数据 + 覆盖原始数据

load data local inpath '/home/centos/files/employee.txt' overwrite into table employee;

# load hdfs 数据 + 覆盖原始数据

load data inpath '/duowan_user.txt' overwrite into table duowan;

[Hive_4] Hive 插入数据的更多相关文章

Hive插入数据的几种常用方法
Hive的几种常见的数据导入方式这里介绍四种:(1).从本地文件系统中导入数据到Hive表:(2).从HDFS上导入数据到Hive表:(3).从别的表中查询出相应的数据并导入到Hive表中:(4).在 ...
hive插入数据-单条
写入数据到hive的hdfs文件中即可,hive创建表的时候用小写做表名,不然查不到相关操作如下: 查看目录与表 hive> dfs -ls /user/hive/warehouse/ 准备h ...
Hive通过查询语句向表中插入数据注意事项
最近在学习使用Hive(版本0.13.1)的过程中,发现了一些坑,它们或许是Hive提倡的比关系数据库更加自由的体现(同时引来一些问题),或许是一些bug.总而言之,这些都需要使用Hive的开发人员额 ...
Hive通过查询语句向表中插入数据过程中发现的坑
前言近期在学习使用Hive(版本号0.13.1)的过程中,发现了一些坑,它们也许是Hive提倡的比关系数据库更加自由的体现(同一时候引来一些问题).也许是一些bug.总而言之,这些都须要使用Hive ...
hive新加入字段插入数据需要注意事项
hive中新加字段需要注意如下 1)如果表中有分区字段,必须先删除分区才能插入数据否则为null; 2)insert override TABLE table1 select counm1,counm ...
Hive/Impala批量插入数据
问题描述现有几千条数据,需要插入到对应的Hive/Impala表中.安排给了一个同事做,但是等了好久,反馈还没有插入完成--看到他的做法是:对每条数据进行处理转换为对应的insert语句,但是,实际 ...
Hive[4] 数据定义 HiveQL
HiveQL 是 Hive 查询语言,它不完全遵守任一种 ANSI SQL 标准的修订版,但它与 MySQL 最接近,但还有显著的差异,Hive 不支持行级插入,更新和删除的操作,也不支持事务,但 H ...
Hive中数据的加载和导出
原文:http://blog.javachen.com/2014/06/09/hive-data-manipulation-language.html 关于 Hive DML 语法,你可以参考 apa ...
kettle连接Hive中数据导入导出（6）
1.hive往外写数据 http://wiki.pentaho.com/display/BAD/Extracting+Data+from+Hive+to+Load+an+RDBMS 连接hive

随机推荐

Perl文件、目录常用操作
注意,这些操作的对象是文件名(相对路径/绝对路径),而非文件/目录句柄,句柄只是perl和文件系统中文件的关联通道,而非实体对象. 创建文件在unix类操作系统中有一个touch命令可以非常方便的创 ...
[React] immutable.js
//Map() 原生object转Map对象 (只会转换第一层,注意和fromJS区别) immutable.Map({name:'danny', age:18}) //List() 原生array转 ...
[转]Illuminate Database
本文转自:https://github.com/illuminate/database Illuminate Database The Illuminate Database component is ...
第一册：lesson ninety one.
原文: Poor lan. Has lan sold his house yet? Yes,he has. He sold it last week. Has he moved to his new ...
Thread类(线程)
操作系统通过线程对程序的执行进行管理,当操作系统运行一个程序的时候,首先,操作系统将为这个准备运行的程序分配一个进程,以管理这个程序所需要的各种资源.在这些资源之中,会包含一个称为主线程的线程数据结构 ...
SpringBoot之前端文件管理
WebJars能使Maven的依赖管理支持OSS的JavaScript库/CSS库,比如jQuery.Bootstrap等. (1)添加js或者css库 pom.xml <dependency& ...
C#通过调用WinApi打印PDF文档类，服务器PDF打印、IIS PDF打印
其他网站下载来的类,可以用于Winform.Asp.Net,用于服务器端PDF或其他文件打印. 直接上代码: using System; using System.Collections.Generi ...
从零开始学安全(七)●Linux基础命令学习笔记
halt 关机reboot 现在重新启动su - 如果当前是普通用户,则输入这条命令切换到管理员用户(root),如果要切换到其他用户则敲入 su - 用户名如: su - wangxin root ...
redis.conf 常见配置介绍
参数说明redis.conf 配置项说明如下: 1. Redis默认不是以守护进程的方式运行,可以通过该配置项修改,使用yes启用守护进程 daemonize no 2. 当Redis以守护进程方式运 ...
Java线程池 Executor框架概述
线程池的意义循环利用线程资源,避免重复创建和销毁线程线程池的任务是异步执行的,只要提交完成就能快速返回,可以提高应用响应性 Java线程池还有一个很重要的意义:Java线程池就是JDK 5 推出的 ...

[Hive_4] Hive 插入数据

0. 说明

1. Hive 插入数据的方法

2. Hive 插入数据的顺序

2.1 先定义好表结构

2.2 准备数据。数据格式要和表结构对应 employee.txt

2.3 空表中使用 load 命令加载数据

2.4 取出所有的成员

3. 插入复杂类型数据 insert

3.0 设置显示表头

3.1 插入复杂类型使用转储

4. load命令详解

4.0 前提：先建表

4.1 使用 load

[Hive_4] Hive 插入数据的更多相关文章

随机推荐

热门专题

　　2.1 先定义好表结构

　　2.2 准备数据。数据格式要和表结构对应 employee.txt

　　2.3 空表中使用 load 命令加载数据

　　2.4 取出所有的成员

　　3.0 设置显示表头

　　3.1 插入复杂类型使用转储

　　4.0 前提：先建表

　　4.1 使用 load