hive 普通创建表和跟新列操作

创建表

CREATE TABLE if not exists student (

  student_id int,

  sex int,

  address String,

  email String

)

这里需要注意的是，虽然hiveSL类似sql语言，但是他们有很多需要注意的地方，不能直接使用符号，比如“'”,“;”这些，分号，hdfs认为是结束的符号。要使用这些符号的话，需要写成他们ask码的形式

还有在创建表时，字段的数据类型，不是使用的sql中的类型，类似java中的类型

create table:创建一个指定名字的表

external 关键字：创建一个外部表，在创建一个外部表时需要给他指定一个指向真实数据的路径(local),在创建一个内部表时，数据会随着你指向的路径儿移动，而创建外部表仅仅记录数据的路径；当删除内部表时：内部表的数据和元数据会随着一起被删除，而删除外部表，就只删除元数据。

like:格式修饰的create table允许复制一个已经存在的表，但是只是复制表的结构，而不复制表的数据

添加表分区

create table student_1(

student_id int,

sex int comment 'sex:0 gg,1 man',

address String comment 'address is student Faily address',

email String

)

partitioned by(ds String,country String)//指定分区，按照地市和时间进行分区，此并没有真正的存储列，也就是此列不存在你的数据中

row format delimited //设置创建表在加载数据的列分割符

fields terminated by '\001'//分割列

stored as sequencefile//需要压缩数据

row format delimited:用户在建表的时候可以自定义 SerDe 或者使用自带的 SerDe。如果没有指定 ROW FORMAT 或者 ROW FORMAT DELIMITED，将会使用自带的 SerDe。在建表的时候，用户还需要为表指定列，用户在指定表的列的同时也会指定自定义的 SerDe，Hive 通过 SerDe 确定表的具体的列的数据。

添加聚类存储

create table student_2(

student_id int,

sex int comment 'sex:0 gg,1 man',

address String comment 'address is student Faily address',

email String

)

comment 'student_2 table view'

partitioned by(ds String,country String)

clustered by(student_id) sorted by (student_id) into 32 buckets//根据sutdent_id进行分区并存储，并对student_id进行排序并放到32个桶中

row format delimited

fields terminated by '\001'

stored as sequencefile

这样组织结构允许用户通过student_id高效的对集群中的列进行采样

修改表的语句 alert（对于已经存在的表）

alert table student_2 to student_3

指定存储路径

create table student_2(

student_id int,

sex int comment 'sex:0 gg,1 man',

address String comment 'address is student Faily address',

email String

)

comment 'student_2 table view'

partitioned by(ds String,country String)

clustered by(student_id) sorted by (student_id) into 32 buckets//根据sutdent_id进行分区并存储，并对student_id进行排序并放到32个桶中

row format delimited

fields terminated by '\001'

stored as sequencefile

location '<hdfs路径>' //表数据存在hdfs上目录，也可以是本地目录

注意：修改表的结构只会对元数据做改变，不会改变数据，用户应该确保元数据的定义和数据结构的一致性

增加和更新列

alert table tableName add|replace colunms(col_name col_type col_moent,.......)

add columns,允许用户在当前列的末尾，未分区之前增加新的列。replace columns删除当前列，增加新的列。只有在

使用native的serDE在能这么做

hive 普通创建表和跟新列操作的更多相关文章

向SQL Server 现有表中添加新列并添加描述.
注: sql server 2005 及以上支持. 版本估计是不支持(工作环境2005,2008). 工作需要, 需要向SQL Server 现有表中添加新列并添加描述. 从而有个如下存储过程. (先 ...
hive中创建表失败
使用create table命令创建表失败,如下错误信息: hive> create table test(id int,name string,age int,sex string); FAI ...
在hive执行创建表的命令，遇到异常com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Specified key was too long; max key length is 767 bytes
今天在练习hive的操作时,在创建数据表时,遇到了异常 FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.ex ...
Oracle入门基础（九）一一创建表和管理表
练习:查询每一年入职人数及总人数 SQL> select count(*) Total, 2 sum(decode(to_char(hiredate,'yyyy'),'1980',1,0)) & ...
使用sql语句创建修改SQL Server标识列(即自动增长列)
一.标识列的定义以及特点SQL Server中的标识列又称标识符列,习惯上又叫自增列.该种列具有以下三种特点:1.列的数据类型为不带小数的数值类型2.在进行插入(Insert)操作时,该列的值是由系统 ...
Hive与HBase表联合使用Join的问题
hive与hbase表结合级联查询的问题,主要hive两个表以上涉及到join操作,就会长时间卡住,查询日志也不报错,也不会出现mr的进度百分比显示,shell显示如下图如图: 解决这个问题,需要修 ...
SQL-表的操作（创建表，删除表，更改列，插入新行，更改行的值，删除表中数据）
一,操作表及列 1.创建表: CREATE TABLE test (ID int PRIMARY KEY IDENTITY,Name varchar(20) ) 2.删除表 DROP TABLE t ...
hive创建表
一.为什么要创建分区表 1.select查询中会扫描整个表内容,会消耗大量时间.由于相当多的时候人们只关心表中的一部分数据, 故建表时引入了分区概念. 2.hive分区表:是指在创建表时指定的part ...
Mysql下在某一列后即表的某一位置添加新列的sql语句
Mysql简介 MySQL是一个开放源码的小型关联式数据库管理系统,开发者为瑞典MySQL AB公司.MySQL被广泛地应用在Internet上的中小型网站中.由于其体积小.速度快.总体拥有成本低,尤 ...

随机推荐

sql特殊语句
1.联表查询 select * from zongyi zongyiitem where zongyi.id=zongyiitem.id 2.联表删除 delete from zongyi ,zong ...
解决：ERROR: Cannot launch Jack server
问题重现: Install: /home/dinphy/sm/out/target/product/ido/system/lib/libdl.so java -Xmx3500m -jar /home/ ...
UIlabel的字体自适应属性
有时候我们需要UIlabel根据字数多少来减小字体大小,使得UIlabel能够显示全所有的文字.你需要做的就是设置minimumScaleFactor.minimumScaleFactor默认值是0, ...
redis源码安装
#安装目录 mkdir -p /data/apps/redis cd /data/tgz wget http://download.redis.io/releases/redis-3.2.1.tar. ...
初学Java 精简知识点总结
面对Java丰富的知识资料,很多初学者难免觉得迷惘,该学什么,怎么去学?下面给大家讲Java基础知识做了精简总结,来帮助你梳理学习思路,赶快看看吧! 方法/步骤1 对象的初始化(1) 非静态对象的初始 ...
面试题目——《CC150》递归与动态规划
面试题9.1:有个小孩正在上楼梯,楼梯有n个台阶,小孩一次可以上1阶.2阶或者3阶.实现一个方法,计算小孩有多少种上楼梯的方式. 思路:第4个数是前三个数之和注意:能不能使用递归,能不能建立一个很大 ...
SDK 支付
充值:用什么买什么 MSDK: Q点:百科 http://baike.baidu.com/link?url=Dw8ySUIvv6AAprULG_wnI7Mst61gG4bO2qzfpfi1j9xx6c ...
apache启动出错原因举例
这是我这两天频繁遇到的问题.Apache服务器还真是问题少年!任何点改动都可能导致它无法使用. 原因一:80端口占用例如IIS,另外就是迅雷.我的apache服务器就是被迅雷害得无法启用! 原因二:软 ...
C语言基础(8)-const,volatile,register关键字
1 const const是定义一个常量 2 volatile 代表定义一个变量,这个变量值可能在CPU指令之外被改变 volatile int a;//定义了一个volatile类型的int变量通 ...
关于学习angularJS 的一些心得
从一开始接触到 angularJS 的时候,一头雾水啊. 下面根据学习资料,主要来阐述一点,关于angularJS学习中需要注意的点 1.angularJS 是可以做到MVC 模式 2.angula ...

hive 普通创建表和跟新列操作

hive 普通创建表和跟新列操作的更多相关文章

随机推荐

热门专题