hadoop笔记之Hive入门(Hive的体系结构)
Hive入门(二)
Hive入门(二)
Hive的体系结构
○ Hive的元数据
- Hive将元数据存储在数据库中(metastore),支持mysql、derby、oracle等数据库,Hive默认是derby数据库
- Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等 
 
○ HQL的执行过程
- 解释器、编译器、优化器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划(Plan)的生成。生成的查询计划存储在HDFS中,并在随后有MapReduce调用执行
详细过程:
- HQL——select
- 解析器——词法分析
- 编译器——生成HQL的执行计划(javacjava –> .class)
- 优化器——生成最佳的执行计划
- 执行
设我们有一个员工信息表,进入到oracle:
SQL> ——查询10号部门的员工信息
SQL> explain plan for select * from emp where deptno=10:
已解释。
SQL> ——查看该select的执行计划
SQL> select * from table(dbms_xplan.display):
执行全表扫描,当然全表扫描的代价相对要高一些 
下面将对部门号建立索引
SQL> creaete index myindex on emp(deptno):
索引已创建。
SQL> explain plan for select * from emp where deptno=10:
已解释。
SQL> select * from table(dbms_xplan.display):
这事就是基于索引的扫描,对于全表扫描更加快速
对于Hive跟oracle是差不多的
所以:
○ hadoop
- 用HDFS进行存储,利用MapReduce进行计算
○ 元数据存储(MetaStore)
- 通常是存储在关系数据库如mysql、derby中
hadoop笔记之Hive入门(Hive的体系结构)的更多相关文章
- hadoop笔记之Hive入门(什么是Hive)
		Hive入门(一) Hive入门(一) 什么是Hive? Hive是个数据仓库,数据仓库就是数据库,但又与一般意义上的数据库有点区别 实际上,Hive是构建在hadoop HDFS上的一个数据仓库. ... 
- hive 学习笔记——表的入门操作和命令
		1.受控表(managed table)包括内部表.分区表.桶表: 1.1.分区表 创建分区表: create table banji(id INT,name STRING) partitioned ... 
- hadoop笔记之Hive的管理(CLI方式)
		Hive的管理(一) Hive的管理(一) Hive的启动方式 CLI(命令行)方式 Web界面方式 远程服务启动方式 CLI方式 1. 进入命令行方式 直接输入<HIVE_HOME>/b ... 
- hive入门学习线路指导
		hive被大多数企业使用,学习它,利于自己掌握企业所使用的技术,这里从安装使用到概念.原理及如何使用遇到的问题,来讲解hive,希望对大家有所帮助.此篇内容较多:看完之后需要达到的目标1.hive是什 ... 
- Hive 入门学习线路指导
		hive被大多数企业使用,学习它,利于自己掌握企业所使用的技术,这里从安装使用到概念.原理及如何使用遇到的问题,来讲解hive,希望对大家有所帮助. 此篇内容较多:看完之后需要达到的目标: 1.hiv ... 
- Hive入门学习随笔(一)
		Hive入门学习随笔(一) ===什么是Hive? 它可以来保存我们的数据,Hive的数据仓库与传统意义上的数据仓库还有区别. Hive跟传统方式是不一样的,Hive是建立在Hadoop HDFS基础 ... 
- 第1章 Hive入门
		第1章 Hive入门 1.1 什么是Hive Hive:由Facebook开源用于解决海量结构化日志的数据统计. Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提 ... 
- Hive Tutorial(上)(Hive 入门指导)
		用户指导 Hive 指导 Hive指导 概念 Hive是什么 Hive不是什么 获得和开始 数据单元 类型系统 内置操作符和方法 语言性能 用法和例子(在<下>里面) 概念 Hive是什么 ... 
- 基于hadoop的数据仓库工具:Hive概述
		Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行.其优点是学习成本低,可以通过类 ... 
随机推荐
- mvn profile 深层次目录打参数核心配置
			<build> <resources> <resource> <directory>src/main/resources</directory&g ... 
- Erp第一章:初感
			Erp第一章:初感1.核心标志实现:内部集成.外部集成.内部集成包括实现产品研发.核心业务.数据采集:外部集成就是企业与供需链上的所有合作伙伴的共享信息集成.2.Erp难点在于打破传统企业四面墙,把流 ... 
- javascript设计模式——Module
			Module模式是提供公有和私有方法的代码块,有利于封装组织代码,可减少变量及函数名与其它模块的冲突. 推荐阅读: http://www.adequatelygood.com/JavaScript-M ... 
- CSS中字体尺寸总结
			下面是我总结的css中关于字体尺寸的知识,欢迎高手拍砖! 前端开发过程中,我们经常会遇到设置某个div固定显示几行文本:这时我们需要精确计算每个字号字体的宽度和高度. 下面是w3school中描述的尺 ... 
- cocos2d-x中常见的场景切换
			本文转载自:http://www.cnblogs.com/linux-ios/archive/2013/04/09/3010779.html bool HelloWorld::init() { /// ... 
- 【自学php】第四天 - 使用数组
			php支持两种数组,数字索引数组和关联数组.关联数组有点类似Map,可以用字符串或其他数据类型做键对应相应的值保存在数组中. 1.初始化数组 数字索引数组的初始化可以使用如下代码: $products ... 
- ListView的Item点击事件(消息传递)
			转载请保留原文出处“http://my.oschina.net/gluoyer/blog”,谢谢! 您可以到博客的“友情链接”中,“程序猿媛(最新下载)*.*”下载最新版本,持续更新!当前版本,也可直 ... 
- AJP协议总结与分析
			Tomcat服务器通过Connector连接器组件与客户程序建立连接,Connector组件负责接收客户的请求,以及把Tomcat服务器的响应结果发送给客户.默认情况下,Tomcat在server.x ... 
- 普林斯顿大学算法课 Algorithm Part I Week 3 快速排序 Quicksort
			发明者:Sir Charles Antony Richard Hoare 基本思想: 先对数据进行洗牌(Shuffle the array) 以数据a[j]为中心进行分区(Partition),使得a ... 
- Spring、Hello Spring
			1.引入Spring jar包 2.新建一个Person 接口和Person Bean public interface PersonIService { public void helloSprin ... 
