Hive是通过把sql转换成对应mapreduce程序，然后提交到Hadoop上执行，查看具体的执行计划可以通过执行explain sql知晓
一条sql会被转化成由多个阶段组成的步骤，每个步骤有执行顺序和依赖关系，可以称之为有向无环图（DAG:Directed Acyclic Graph）
这些步骤可能包含：元数据的操作，文件系统的操作，map/reduce计算等
语法格式：

EXPLAIN [EXTENDED|DEPENDENCY|AUTHORIZATION|LOCKS|VECTORIZATION] query

explain输出内容包括：
- 抽象语法树
- 执行计划不同阶段的依赖关系
- 各个阶段的描述
extended输出更加详细的信息
denpendency输出依赖的数据源
authorization输出执行sql授权信息
locks 输出锁情况
vectorization相关
- Adds detail to the EXPLAIN output showing why Map and Reduce work is not vectorized.
- Syntax: EXPLAIN VECTORIZATION [ONLY] [SUMMARY|OPERATOR|EXPRESSION|DETAIL]
- ONLY option suppresses most non-vectorization elements.
- SUMMARY (default) shows vectorization information for the PLAN (is vectorization enabled) and a summary of Map and Reduce work.
- OPERATOR shows vectorization information for operators. E.g. Filter Vectorization. Includes all information of SUMMARY.
- EXPRESSION shows vectorization information for expressions. E.g. predicateExpression. Includes all information of SUMMARY and OPERATOR.
- DETAIL shows detail-level vectorization information. It includes all information of SUMMARY, OPERATOR, and EXPRESSION.
带上FORMATTED 关键子，可以json格式输出
sort order： +表示升序 -表示降序
大概了解一下相关的执行情况

# explain默认

0: jdbc:hive2://> explain select * from sort_test sort by id desc limit 10;

+--------------------------------------------------------------------------------------------------+--+

|                                             Explain                                              |

+--------------------------------------------------------------------------------------------------+--+

| STAGE DEPENDENCIES:                                                                              |

|   Stage-1 is a root stage                                                                        |

|   Stage-2 depends on stages: Stage-1                                                             |

|   Stage-0 depends on stages: Stage-2                                                             |

|                                                                                                  |

| STAGE PLANS:                                                                                     |

|   Stage: Stage-1                                                                                 |

|     Map Reduce                                                                                   |

|       Map Operator Tree:                                                                         |

|           TableScan                                                                              |

|             alias: sort_test                                                                     |

|             Statistics: Num rows: 8 Data size: 890 Basic stats: COMPLETE Column stats: NONE      |

|             Select Operator                                                                      |

|               expressions: id (type: int), name (type: string)                                   |

|               outputColumnNames: _col0, _col1                                                    |

|               Statistics: Num rows: 8 Data size: 890 Basic stats: COMPLETE Column stats: NONE    |

|               Reduce Output Operator                                                             |

|                 key expressions: _col0 (type: int)                                               |

|                 sort order: -                                                                    |

|                 Statistics: Num rows: 8 Data size: 890 Basic stats: COMPLETE Column stats: NONE  |

|                 value expressions: _col1 (type: string)                                          |

|       Reduce Operator Tree:                                                                      |

|         Select Operator                                                                          |

|           expressions: KEY.reducesinkkey0 (type: int), VALUE._col0 (type: string)                |

|           outputColumnNames: _col0, _col1                                                        |

|           Statistics: Num rows: 8 Data size: 890 Basic stats: COMPLETE Column stats: NONE        |

|           Limit                                                                                  |

|             Number of rows: 10                                                                   |

|             Statistics: Num rows: 8 Data size: 890 Basic stats: COMPLETE Column stats: NONE      |

|             File Output Operator                                                                 |

|               compressed: false                                                                  |

|               table:                                                                             |

|                   input format: org.apache.hadoop.mapred.SequenceFileInputFormat                 |

|                   output format: org.apache.hadoop.hive.ql.io.HiveSequenceFileOutputFormat       |

|                   serde: org.apache.hadoop.hive.serde2.lazybinary.LazyBinarySerDe                |

|                                                                                                  |

|   Stage: Stage-2                                                                                 |

|     Map Reduce                                                                                   |

|       Map Operator Tree:                                                                         |

|           TableScan                                                                              |

|             Reduce Output Operator                                                               |

|               key expressions: _col0 (type: int)                                                 |

|               sort order: -                                                                      |

|               Statistics: Num rows: 8 Data size: 890 Basic stats: COMPLETE Column stats: NONE    |

|               value expressions: _col1 (type: string)                                            |

|       Reduce Operator Tree:                                                                      |

|         Select Operator                                                                          |

|           expressions: KEY.reducesinkkey0 (type: int), VALUE._col0 (type: string)                |

|           outputColumnNames: _col0, _col1                                                        |

|           Statistics: Num rows: 8 Data size: 890 Basic stats: COMPLETE Column stats: NONE        |

|           Limit                                                                                  |

|             Number of rows: 10                                                                   |

|             Statistics: Num rows: 8 Data size: 890 Basic stats: COMPLETE Column stats: NONE      |

|             File Output Operator                                                                 |

|               compressed: false                                                                  |

|               Statistics: Num rows: 8 Data size: 890 Basic stats: COMPLETE Column stats: NONE    |

|               table:                                                                             |

|                   input format: org.apache.hadoop.mapred.TextInputFormat                         |

|                   output format: org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat      |

|                   serde: org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe                      |

|                                                                                                  |

|   Stage: Stage-0                                                                                 |

|     Fetch Operator                                                                               |

|       limit: 10                                                                                  |

|       Processor Tree:                                                                            |

|         ListSink                                                                                 |

|                                                                                                  |

+--------------------------------------------------------------------------------------------------+--+

# authorization

0: jdbc:hive2://> explain formatted authorization  select * from sort_test sort by id desc limit 10;

+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--+

|                                                                                                               Explain                                                                                                               |

+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--+

| {"CURRENT_USER":"root","OPERATION":"SWITCHDATABASE","INPUTS":["badou@sort_test"],"OUTPUTS":["hdfs://master:9000/tmp/hive/root/fac1e10c-babb-4927-886e-411b3e9190fb/hive_2018-10-18_11-04-47_534_1155924552647075339-1/-mr-10000"]}  |

+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+--+

参考资料

【0】Hive wiki - LanguageManual Explain

【1】hive入门学习：explain执行计划的理解

Hive之执行计划分析(explain)的更多相关文章

MySQL学习系列2--MySQL执行计划分析EXPLAIN
原文:MySQL学习系列2--MySQL执行计划分析EXPLAIN 1.Explain语法 EXPLAIN SELECT …… 变体: EXPLAIN EXTENDED SELECT …… 将执行 ...
MySQL学习系列2--MySQL执行计划分析EXPLAIN [原创]
1.Explain语法 EXPLAIN SELECT …… 变体: EXPLAIN EXTENDED SELECT …… 将执行计划“反编译”成SELECT语句,运行SHOW WARNINGS 可 ...
分析oracle的执行计划（explain plan）并对对sql进行优化实践
基于oracle的应用系统很多性能问题,是由应用系统sql性能低劣引起的,所以,sql的性能优化很重要,分析与优化sql的性能我们一般通过查看该sql的执行计划,本文就如何看懂执行计划,以及如何通过分 ...
Hive SQL执行流程分析
转自 http://www.tuicool.com/articles/qyUzQj 最近在研究Impala,还是先回顾下Hive的SQL执行流程吧. Hive有三种用户接口: cli (Command ...
MongoDB执行计划分析详解
要保证数据库处于高效.稳定的状态,除了良好的硬件基础.高效高可用的数据库架构.贴合业务的数据模型之外,高效的查询语句也是不可少的.那么,如何查看并判断我们的执行计划呢?我们今天就来谈论下MongoDB ...
SQL执行计划分析
explain执行计划中的字段以及含义在下面的博客中有详细讲述: https://blog.csdn.net/da_guo_li/article/details/79008016 执行计划能告诉我们什 ...
转:Oracle 执行计划（Explain Plan）说明
Oracle 执行计划(Explain Plan) 说明原贴地址:http://blog.csdn.net/tianlesoftware/article/details/5827245 如果要分 ...
mysql，存储引擎，事务，锁，慢查询，执行计划分析，sql优化
基础篇:MySql架构与存储引擎逻辑架构图: 连接层: mysql启动后(可以把mysql类比为一个后台的服务器),等待客户端请求,当请求到来后,mysql建立一个一个线程处理(线程池则分配一个空线 ...
MongoDB干货系列2-MongoDB执行计划分析详解（2）（转载）
写在之前的话作为近年最为火热的文档型数据库,MongoDB受到了越来越多人的关注,但是由于国内的MongoDB相关技术分享屈指可数,不少朋友向我抱怨无从下手. <MongoDB干货系列> ...

随机推荐

Unity笔记（4）自学第四、五天
主要是移动脚本和2个技能的脚本编写. 首先是移动的脚本: using System.Collections; using System.Collections.Generic; using Unity ...
Mac下部署与启动STF
一.stf在Mac下的部署1.安装Java及jdk可自己谷歌(如果不能自建云梯)2.安装nodejs包(我是直接在官网下载的LTS版本) • Node.js v8.12.0 to /usr/local ...
Dragger2解析（一）
依赖注入(DI-Dependency Injection) 什么是依赖注入这是一种设计思想,一个面向对象的编程法则. DI能够让开发者写出低耦合代码,更加优良的程序. 更容易测试,代码健壮性更强. ...
Activity的四种启动模式区别
(1) standard 模式启动模式,每次激活Activity时都会创建Activity,并放入任务栈中. (2) singleTop 如果在任务的栈顶正好存在该Activity的实例, 就重用该实 ...
契约式设计（DbC）感想（二）
契约式设计6大原则的理解在<Design by Contract原则与实践>中,作者定义了契约式设计的6大原则: 区分命令和查询: 将基本查询和派生查询区分开: 针对每个派生查询,设定一 ...
Node.js——优先从缓存加载
main中执行require操作,目的是获取接口对象,所以多次引用b,并不会重复执行模块内部的输入输出,因为缓存中已经存在
Ubuntu14.04环境下java web运行环境搭建
1.jdk安装将下载好的安装包上传至/home目录解压 tar -zxvf jdk-8u71-linux-x64.tar.gz 执行 vim /etc/profile 在末尾添加java环境变量(J ...
https://quotefancy.com/ 经典句子（英语）真是特别好~
https://quotefancy.com/ 经典句子(英语)
Python框架Django的入门
本篇文章主要给大家介绍Django的入门知识:
11-3 re模块
目录 r 的作用 re模块的常用功能 findall search match split sub 将数字替换成'H' subn 将数字替换成'H',返回元组(替换的结果,替换了多少次) compil ...

Hive之执行计划分析(explain)

参考资料

Hive之执行计划分析(explain)的更多相关文章

随机推荐

热门专题