Hive笔记及配置
Hive
基于Hadoop的数据仓库工具;
将结构化的数据文件,映射为一张表,并提供类SQL查询功能;
本质:将HQL转化为MapReduce程序;


- Hive处理的数据存储在HDFS; 
- Hive分析数据底层的默认实现是MapReduce; 
- 执行程序是在Yarn上; 
特点
- Hive执行延迟高,适用于对实时性要求不高的场景;优势在于处理大数据,不适合处理小数据 
- (MR)不适合迭代式运算,不适合数据挖掘; 
- (MR)效率低; 
- 调优困难,粒度太粗; 
- 作为数据仓库的Hive,是读多写少,基本不修改; 
- 没有索引,查询数据,要暴力扫描所有的数据(分区表可以减少搜索范围),延迟较高(主要由于MapReduce的框架本身延迟较高); 
Hive配置
准备
- hive-site.xml - <?xml version="1.0" encoding="UTF-8" standalone="no"?> 
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 <configuration>
 <property>
 <name>javax.jdo.option.ConnectionURL</name>
 <value>jdbc:mysql://master:3306/metastore?createDatabaseIfNotExist=true</value>
 <description>metastore地址</description>
 </property>
 <property>
 <name>javax.jdo.option.ConnectionDriverName</name>
 <value>com.mysql.jdbc.Driver</value>
 <description>Driver name</description>
 </property>
 <property>
 <name>javax.jdo.option.ConnectionUserName</name>
 <value>whr</value>
 <description>username</description>
 </property>
 <property>
 <name>javax.jdo.option.ConnectionPassword</name>
 <value>123456</value>
 <description>password</description>
 </property>
 <property>
 <name>hive.cli.print.header</name>
 <value>true</value>
 </property>
 <property>
 <name>hive.cli.print.current.db</name>
 <value>true</value>
 <!--交互界面显示数据库名-->
 </property>
 </configuration>
- hive.env.sh - # 添加两个配置 
 HADOOP_HOME=/home/whr/workbench/hadoop
 export HIVE_CONF_DIR=/home/whr/workbench/hive/conf
- 初始化,也可以先创建数据库,这里有点简化了mysql的操作,mysql中的数据库以及用户权限要配置好,不然会初始化失败: - schematool -dbType mysql -initSchema 
元数据
将derby元数据,放进mysql;
在mysql的hivedb中存在很多张表,记录着元数据代表着各种信息:
COLUMNS_V2 # 记录着列的信息
TBLS # 记录着已创建的表名以及创建时间,OWNER...
VERSION # hive版本信息
...
Hive笔记及配置的更多相关文章
- Hive学习笔记——基本配置及测试
		1.什么是Hive Hive 是建立在 Hadoop上的数据仓库基础构架.它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储.查询和分析存储在Hadoop中的大规模数据的机 ... 
- hadoop2.2.0 + hbase 0.94 + hive 0.12 配置记录
		一开始用hadoop2.2.0 + hbase 0.96 + hive 0.12 ,基本全部都配好了.只有在hive中查询hbase的表出错.以直报如下错误: java.io.IOException: ... 
- 【转】hive简介安装 配置常见问题和例子
		原文来自: http://blog.csdn.net/zhumin726/article/details/8027802 1 HIVE概述 Hive是基于Hadoop的一个数据仓库工具,可以将结构化 ... 
- Hive的安装配置
		Hive的安装配置 Hive的安装配置 安装前准备 下载Hive版本1.2.1: 1.[root@iZ28gvqe4biZ ~]# wget http://mirror.bit.edu.cn/apac ... 
- Hive安装与配置详解
		既然是详解,那么我们就不能只知道怎么安装hive了,下面从hive的基本说起,如果你了解了,那么请直接移步安装与配置 hive是什么 hive安装和配置 hive的测试 hive 这里简单说明一下,好 ... 
- 《玩转Django2.0》读书笔记-Django配置信息
		<玩转Django2.0>读书笔记-Django配置信息 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 项目配置是根据实际开发需求从而对整个Web框架编写相应配置信息. ... 
- [hive] hive 安装、配置
		一.hive安装 1.官网下载 1.2.2版本 http://apache.fayea.com/hive/hive-1.2.2/ 2. 解压,此处目录为 /opt/hadoop/hive-1.2.2 ... 
- Hive安装与配置--- 基于MySQL元数据
		hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行. 其优点是学习成本低,可以通过 ... 
- 【Hive一】Hive安装及配置
		Hive安装及配置 下载hive安装包 此处以hive-0.13.1-cdh5.3.6版本的为例,包名为:hive-0.13.1-cdh5.3.6.tar.gz 解压Hive到安装目录 $ tar - ... 
随机推荐
- 【PHP】 php遍历文件夹文件,获取md5的值
			方法: <?php //定义操作目录 $dir = 'D:\phpstudy\WWW\test'; function getDir2($dir) { foreach (glob($dir . ' ... 
- Linux系统调优——Memory内存(二)
			(1).查看Memory(内存)运行状态相关工具 1)free命令查看内存使用情况 [root@youxi1 ~]# free -m //-m选项,以MB为单位显示 total used free s ... 
- Java extract amplitude array from recorded wave
			转载自:http://ganeshtiwaridotcomdotnp.blogspot.com/2011/12/java-extract-amplitude-array-from.html Extra ... 
- pipline中使用ansible
			实验架构: 192.168.0.96 gitlab 192.168.0.97 jenkins.ansible 192.168.0.98 harbor.docker集群 说明:下面代码编译镜像那一步的代 ... 
- C语言实现从左向右字幕滚动的效果
			#include <stdio.h> #include <string.h> #include <windows.h> int main() { char str[ ... 
- CVE-2019-2725修复(删包)
			本来想试试打补丁,但是有些麻烦,而且oracle补丁黑名单的方式总不让人放心. 因此考虑直接删除相关的包. 该方式适用于xmldecoder漏洞系列,如CVE-2017-3506.CVE-2017-1 ... 
- 《ucore lab8》实验报告
			资源 ucore在线实验指导书 我的ucore实验代码 练习1: 完成读文件操作的实现(需要编码) 题目 首先了解打开文件的处理流程,然后参考本实验后续的文件读写操作的过程分析,编写在sfs_inod ... 
- java8中常用的新功能
			Lambda表达式的用法,并行流.Optional.循环.线程池等 
- [Xamarin] - "GenerateJavaStubs" 异常之解决
			背景 新建的 Xamarin 项目,编译失败. Error The "GenerateJavaStubs" task failed unexpectedly.Error The s ... 
- WCF-方法重载
			一.服务端重载 一般写法直接重载,但是会报错,如下. [ServiceContract] public interface IService1 { [OperationContract] string ... 
