hive -- 分区,分桶(创建,修改,删除) 分区: 静态创建分区: 1. 数据: john doe 10000.0 mary smith 8000.0 todd jones 7000.0 boss man 20000.0 freed finance 15000.0 stacy saber 4000.0 建表+添加一个数据 create table if not exists employees( name string, money float) row format delimited f…
分桶表 将数据按照指定的字段进行分成多个桶中去,说白了就是将数据按照字段进行划分,可以将数据按照字段划分到多个文件当中去 开启hive的桶表功能 set hive.enforce.bucketing=true; 设置reduce的个数 set mapreduce.job.reduces=3; 创建桶表 create table course (c_id string,c_name string,t_id string) clustered by(c_id) into 3 buckets row…
1. hive的简介(具体见文档) Hive是分析处理结构化数据的工具   本质:将hive sql转化成MapReduce程序或者spark程序 Hive处理的数据一般存储在HDFS上,其分析数据底层的实现是MapReduce/spark,执行程序运行在Yarn上 其大致可以按如下图理解(具体可见HIVE文档) sql语句是对某个表进行操作,所以hive一定要创建一个表格,这个表格必须要映射到hdfs中某个具体的文件才行,而映射关系.表的结构数据以及hdfs中数据的存储结构都会在创建表时规定,…
原文:http://blog.javachen.com/2014/06/09/hive-data-manipulation-language.html 关于 Hive DML 语法,你可以参考 apache 官方文档的说明:Hive Data Manipulation Language. apache的hive版本现在应该是 0.13.0,而我使用的 hadoop 版本是 CDH5.0.1,其对应的 hive 版本是 0.12.0.故只能参考apache官方文档来看 cdh5.0.1 实现了哪些…
Hive中数据加载失败:inode=:root:supergroup:drwxr-xr-x 在执行hive,数据加载的时候,遇到了一个错误,如下图: 在执行程序的过程中,遇到权限问题很正常,背后原理也不是很懂,但是通过修改配置,问题已经解决了. 解决方法:hadoop 的hdfs-site文件中添加以下内容,关闭权限检查 ,然后重启Hadoop集群,即解决了上述问题. <property> <name>dfs.permissions</name>         <…
如何每日增量加载数据到Hive分区表 hadoop hive shell crontab 加载数据 数据加载到Hive分区表(两个分区,日期(20160316)和小时(10))中 每日加载前一天的日志文件数据到表db_track.track_log 1. 数据存储 数据日志文件,放入某个目录下,每天日志文件放入同一个目录 eg: 20160316 - 目录名称 日志文件数据,每个小时生成一个文件,一天总共有二十四个文件 eg: 2016031820 2. shell脚本编写 负责调度的shell…
9.3. 创建数据库表 创建student表 CREATE TABLE IF NOT EXISTS mydb1.student (name STRING, age INT, contact INT ); 创建employ表 create table employee (Id INT, name STRING, age INT,address STRING, salary BIGINT); 9.3.1. 数据库表中插入数据 insert into employee (ID,NAME,AGE,ADD…
一.Oracle基础数据类型:数据类型: 创建数据表时,设计数据表的结构问题,也就是设计及确定数据表中各个列的数据类型,是数值.字符.日期还是图像等其他类型. 因为只有设计好数据表结构,系统才会在磁盘开辟相应的空间,用户才能向表中填写数据.  4类: 字符型:字符串 char(最大2000), nchar(最大1000, 支持Unicode)--->固定长度的字符串. varchar(最大4000), nvarchar2(最大2000, 支持Unicode)--->可变长度的字符串. 数字类型…
通过hive-jdcv连接hive server,在应用服务端执行以下命令,报错:Hiver Server节点上找不到data.txt load data local inpath '/home/dw_hbkas/przhang/data.txt' overwrite into table ind01acom 原因如下: When using the JDBC driver, the command executes on the HiveServer2 side. The file is ev…
1. insert 插入数据 要保证启动了jobhistory 否则会抛出异常 hdfs中查看内容 2. create table 表名字 select 字段... from  表名 hdfs查看数据 3. load data  加载, row format 指定数据的分隔符 '|'…