Hive Getting Started补充

不要乱摸 2024-10-26 23:05:22 原文

配置管理概述

Hive从<install-dir>/conf/hive-default.xml中读取它的默认配置
Hive配置目录的位置可以通过设置HIVE_CONF_DIR环境变量的值来改变
配置变量可以被改变，通过<install-dir>/conf/hive-site.xml中重新定义（PS：意思就是可以hive-site.xml中的配置项可以覆盖hive-default.xml中同名的配置）
Log4j配置存储在<install-dir>/conf/hive-log4j.properties
Hive配置默认继承Hadoop配置变量
在hive-site.xml中可以定义任何你需要的配置变量，包括hadoop中的配置变量也是可以定义在这里面的

Hive日志

Hive用log4j记录日志，默认情况下通过命令行操作的日志会输出到控制台。默认的日志级别是INFO。

日志文件存放的目录是/tmp/<user.name>:

/tmp/<user.name>/hive.log

通过在$HIVE_HOME/conf/hive-log4j.properties中设置hive.log.dir可以改变日志存放的目录，务必确保该目录的权限是1777

DDL操作

创建Hive表

创建一个表，名字叫做pokes，它有两列，第一列是integer类型，第二列是string类型

创建一个表，名字叫invites。它有两个列和一个名字叫ds的分区列。这个分区列是一个虚的列，它不是表数据的的一部分，它在将一个特别的数据集加载到分区的时候很有用。

DML操作

加载一个文件到pokes表，这个文件有两列，列用ctrl-a分隔。'LOCAL'表示输入文件在本地文件系统，如果'LOCAL'被省略的话，将从HDFS中查找文件。

关键'OVERWRITE'表示如何表中存在数据则会被删除。如果'OVERWRITE'关键字被省略，那么数据文件则会被追加到已有的数据后面。

注意：

通过加装命令加装数据的时候不会验证数据是否违背schema
如果文件在HDFS中，那么将被移动到Hive所控制的命名空间中
Hive数据的根目录是在hive-default.xml中hive.metastore.warehouse.dir指定的

上面的两条加载语句分别加载数据到invites表的不同分区中。表invites在创建的时候必须被分区，并且分区的名字叫ds。

上面这条命令从HDFS中加载数据到表中。

注意，从HDFS中加载数据的结果就是移动文件或目录，因此，这个操作非常快。

Hive Getting Started补充的更多相关文章

hive hwi使用
hwi(hive web interface)是hive命令行接口的补充. 使用方法: 1.配置: 在配置文件hive-site.xml 中,默认有hwi的配置 <property> &l ...
Hive学习之路（四）Hive的连接3种连接方式
一.CLI连接进入到 bin 目录下,直接输入命令: [hadoop@hadoop3 ~]$ hive SLF4J: Class path contains multiple SLF4J bindi ...
Hive（四）Hive的3种连接方式与DbVisualizer连接Hive
一.CLI连接进入到 bin 目录下,直接输入命令: [root@node21 ~]# hive SLF4J: Class path contains multiple SLF4J bindings ...
Apache Hive （四）Hive的连接3种连接方式
转自:https://www.cnblogs.com/qingyunzong/p/8715925.html 一.CLI连接进入到 bin 目录下,直接输入命令: [hadoop@hadoop3 ~] ...
配置hive环境以及mysql配置后必须做
1.先在主节点上安装阿里云配置(看别的文档) 2.把需要的两个jar包加入进来(放到hadoop用户目录下面即可即/home/hadoop/) mysql-connector-java-5.1.47. ...
大数据和Hadoop生态圈
大数据和Hadoop生态圈一.前言: 非常感谢Hadoop专业解决方案群:313702010,兄弟们的大力支持,在此说一声辛苦了,经过两周的努力,已经有啦初步的成果,目前第1章大数据和Hadoop ...
presto 0.166概述
presto是什么是Facebook开源的,完全基于内存的并⾏计算,分布式SQL交互式查询引擎是一种Massively parallel processing (MPP)架构,多个节点管道式执⾏ ...
Hadoop专业解决方案-第1章大数据和Hadoop生态圈
一.前言: 非常感谢Hadoop专业解决方案群:313702010,兄弟们的大力支持,在此说一声辛苦了,经过两周的努力,已经有啦初步的成果,目前第1章大数据和Hadoop生态圈小组已经翻译完成,在此 ...
值得关注的sql-on-hadoop框架
http://www.infoq.com/cn/news/2014/06/sql-on-hadoop 数据的操作语言是SQL,因此很多工具的开发目标自然就是能够在Hadoop上使用SQL.这些工具有些 ...

随机推荐

数据结构（C实现）------- 最小生成树之Prim算法
[本文是自己学习所做笔记.欢迎转载.但请注明出处:http://blog.csdn.net/jesson20121020] 算法描写叙述假设连通图是一个网,则称该网中全部生成树中权值总和最小的生成树 ...
myeclipse tomcat java.lang.OutOfMemoryError: PermGen space错误的解决方法
错误代码: java.lang.OutOfMemoryError: PermGen space 原因分析: myeclipse或tomcat的内容分配的不够用,启动失败解决方法: 1.找到tomca ...
Java 并发专题： Executor具体介绍打造基于Executor的Webserver
转载标明出处:http://blog.csdn.net/lmj623565791/article/details/26938985 继续并发,貌似并发的文章非常少有人看啊~哈~ 今天准备具体介绍jav ...
ImageLoader配置（凝视）
/** * 配置ImageLoader */ private void configImageLoader() { File discCacheDir = StorageUtils.getOwnCac ...
NIO相关基础篇三
转载请注明原创出处,谢谢! 说在前面上篇NIO相关基础篇二,主要介绍了文件锁.以及比较关键的Selector,本篇继续NIO相关话题内容,主要谈谈一些Linux 网络 I/O模型.零拷贝等一些内容, ...
接触HTML和CSS心得体会
1.HTML 它负责网页的三个要素之中的结构: HTML使用标签的形式来标识网页中的不同组成部分 <!DOCTYPE html> <html> <head> < ...
eoLinker 新功能发布，增加了识别代码注释自动生成文档功能
产品地址:https://www.eolinker.com开源代码:https://www.eolinker.com/#/os/download在线生成代码注释工具:http://tool.eolin ...
微信小程序——微信支付
这个讲起来也就比较麻烦一点,因为需要的不仅仅是咱们代码上的技术,嘿嘿! 先整理一下思路.如果想做微信支付: 1.现有一个公司账户(非个人账户),并且实名认证过的. 2.微信号必须开通微信支付功能. ...
HTML页面中JavaScript能获取到的各种屏幕大小信息
在HTML页面中,通过JavaScript代码访问 window 对象,能够获取到很多表征屏幕大小的信息,下面列举并加以区分. window 对象中的屏幕信息 window.innerheight. ...
《程序员修炼之道：从小工到专家》【PDF】下载
<程序员修炼之道:从小工到专家>[PDF]下载链接: https://u253469.ctfile.com/fs/253469-231196340 内容简介 <程序员修炼之道> ...