038 关于HIVE的配置
一:常用版本
1.版本
0.13.1 2014年
1.2.1 2015年
版本之间的区别:支持SQL不同,向关系型数据库靠拢。
目前看到的版本是2.3.2了。
2.官网

二:安装配置hive
1.检测hadoop

2.解压hive

3.修改环境
sudo vi /etc/profile

4.source以下
5.复制hive-env.sh

6.编辑hive-env.sh
设置hadoop的配置环境,因为hive需要hadoop,不然hive和hadoop没有关联。
hive的配置文件目录要启动的,因为除了默认的hive加载,自定义的hive文件在conf下,也需要加载。

7.在HDFS上创建文件夹并修改写权限
同组可写权限。
保存hive的数据,主要放在HDFS上的warehouse文件夹下。
说明:
为啥是这个目录。因为hive.metastore.warehouse.dir在默认文件中的位置是这个位置,所以就设置了这个目录。

8.验证hive的安装
属于启动。
进入hive的命令行。

二:操作hive
1.显示有哪些数据库
有一个default数据库。
说明:
假设在这个数据库下创建一个表,这个表就在user/hive/warehouse文件夹下。

2.创建数据库

3.在新建的数据库中新建表
使用新建的数据库
use hadoop09;
这个使用的字符串是string,不是varchar,因为底层是hadoop。

4.加载数据
首先要书写数据:

加载数据:

5.HDFS里文件的分布
一开始是数据仓库文件。
hadoop09是数据库,所以生成的文件名字教hadoop09.db。
student是一张表。
里面有一个文件,是数据文件,这个文件也是刚才在本地编辑的文件。

维护都是使用文件夹。
6.hive查询语句

三:hive的问题
1.问题的由来
当开启第二个hive的时候,就会出现问题。
因为hive的默认数据库使用的是derby,只能启用一个实例,所以不适合企业。
解决的方案是:使用mysql关系数据库代替derby。

四:配置mysql
1.卸载已经安装的mysql

2.安装mysql

3.查看mysql的状态

4.开启服务

5.设置开机启动

6.设置密码

7.进入数据库

8.修改连接权限的位置



9.修改连接权限
增加一个权限

删除其他的

10.刷新权限,退出,重启服务

以上的mysql已经配置完成
五.配置hive
1.生成hive-site.xml

2.配置hive-site.xml、
官网位置:

修改的配置:

3.在lib下加入驱动

4.启动hive

5.观看效果
出现了metastore数据库。

六:日志的配置问题
1.问题的由来

2.在conf中启用

3.修改配置,hive运行的日志配置

七.人性化设置
1.列名,数据库名

2.效果

038 关于HIVE的配置的更多相关文章
- Hive安装配置指北(含Hive Metastore详解)
个人主页: http://www.linbingdong.com 本文介绍Hive安装配置的整个过程,包括MySQL.Hive及Metastore的安装配置,并分析了Metastore三种配置方式的区 ...
- Hadoop之Hive(2)--配置Hive Metastore
Hive metastore服务以关系性数据库的方式存储Hive tables和partitions的metadata,并且提供给客户端访问这些数据的metastore service的API.下面介 ...
- 【转】 hive安装配置及遇到的问题解决
原文来自: http://blog.csdn.net/songchunhong/article/details/51423823 1.下载Hive安装包apache-hive-1.2.1-bin.ta ...
- hive权限配置
基于CDH5.x的Hive权限配置 1.打开权限控制,默认是没有限制的 set hive.security.authorization.enabled=true; 2.配置默认权限 hive.secu ...
- Hive的配置| 架构原理
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能. 本质是:将HQL转化成MapReduce程序 1)Hive处理的数据存储在HDFS 2)Hi ...
- Mac上Hive安装配置
Mac上Hive安装配置 1.安装 下载hive,地址:http://mirror.bit.edu.cn/apache/hive/ 之前我配置了集群,tjt01.tjt02.tjt03,这里hive安 ...
- Hive的配置详解和日常维护
Hive的配置详解和日常维护 一.Hive的参数配置详解 1>.mapred.reduce.tasks 默认为-1.指定Hive作业的reduce task个数,如果保留默认值,则Hive 自 ...
- Hive安装配置详解步骤以及hive使用mysql配置
Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据.它架构在Hadoop之上,总归为大数据,并使得查询和分析方便.并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务 ...
- Hive设置配置参数的方法,列举8个常用配置
Hive设置配置参数的方法 Hive提供三种可以改变环境变量的方法,分别是: (1).修改${HIVE_HOME}/conf/hive-site.xml配置文件: (2).命令行参数: (3).在已经 ...
随机推荐
- 51nod1222 最小公倍数计数
题目来源: Project Euler 基准时间限制:6 秒 空间限制:131072 KB 分值: 640 定义F(n)表示最小公倍数为n的二元组的数量. 即:如果存在两个数(二元组)X,Y(X & ...
- iOS视频流开发(2)—视频播放
承上篇,本篇文章主要介绍iOS视频播放需要用到的类.以及他们的使用场景和开发中遇到的问题. MPMoviePlayerViewController MP简介 iOS提供MPMoviePlayerCon ...
- Android Studio导入系统 jar包,编译时优先于查找系统SDK
https://www.cnblogs.com/bluestorm/p/6744140.html
- 关注网页的更新状况,了解最新的handsup 消息.
// 第一部分是网页截图和源码保存 // upon page load. var fs = require("fs"); var resourceWait = 300, maxRe ...
- java多线程系列六、线程池
一. 线程池简介 1. 线程池的概念: 线程池就是首先创建一些线程,它们的集合称为线程池. 2. 使用线程池的好处 a) 降低资源的消耗.使用线程池不用频繁的创建线程和销毁线程 b) 提高响应速度,任 ...
- (常用)time,datetime,random,shutil(zipfile,tarfile),sys模块
a.time模块import time 时间分为三种形式1.时间戳 (时间秒数的表达形式, 从1970年开始)print(time.time())start_time=time.time()time. ...
- 云服务器 linux文件系统异常an error occurren during the file system check导致服务器启动失败
云服务器 linux文件系统异常an error occurren during the file system check导致服务器启动失败 文件系统宕机,重启后报错,无法启动 处理流程: 1.编辑 ...
- centos6.7安装系统后看不到网卡无法配置IP的解决办法
新安装centos6.7后发现/etc/sysconfig/network-scripts目录下没有eth0的网卡配置,通过ifconfig可以看到eth0的硬件地址 于是新建网卡输入一下内容 # c ...
- dell R720服务器设置开机启动顺序
开机按F2进入系统启动设置,也可以按F11进入快速启动配置
- quartz在application中的使用
项目结构图: TestMain.java package com; import org.quartz.Scheduler; import org.quartz.impl.StdSchedulerFa ...