Hive 执行计划

执行语句

hive> explain select s.id, s.name from student s left outer join student_tmp st on s.name = st.name;

结果，红色字体为我添加的注释

hive> explain select s.id, s.name from student s left outer join student_tmp st on s.name = st.name;

OK

ABSTRACT SYNTAX TREE:

  (TOK_QUERY (TOK_FROM (TOK_LEFTOUTERJOIN (TOK_TABREF (TOK_TABNAME student) s) (TOK_TABREF (TOK_TABNAME student_tmp) st) (= (. (TOK_TABLE_OR_COL s) name) (. (TOK_TABLE_OR_COL st) name)))) (TOK_INSERT (TOK_DESTINATION (TOK_DIR TOK_TMP_FILE)) (TOK_SELECT (TOK_SELEXPR (. (TOK_TABLE_OR_COL s) id)) (TOK_SELEXPR (. (TOK_TABLE_OR_COL s) name)))))

STAGE DEPENDENCIES: “这个sql将被分成两个阶段执行。基本上每个阶段会对应一个mapreduce job，Stage-0除外。因为Stage-0只是fetch结果集，不需要mapreduce job”

  Stage- is a root stage

  Stage- is a root stage

STAGE PLANS:

  Stage: Stage-

    Map Reduce

      Alias -> Map Operator Tree: “map job开始”

        s

          TableScan

            alias: s “扫描表student”

            Reduce Output Operator “这里描述map的输出，也就是reduce的输入。比如key，partition，sort等信息。”

              key expressions: “reduce job的key”

                    expr: name

                    type: string

              sort order: + “这里表示按一个字段排序，如果是按两个字段排序，那么就会有两个+(++),更多以此类推”

              Map-reduce partition columns: “partition的信息，由此也可以看出hive在join的时候会以join on后的列作为partition的列，以保证具有相同此列的值的行被分到同一个reduce中去”

                    expr: name

                    type: string

              tag: 0 “用于标示这个扫描的结果，后面的join会用到它”

              value expressions: “表示select 后面的列”

                    expr: id

                    type: int

                    expr: name

                    type: string

        st

          TableScan “开始扫描第二张表，和上面的一样”

            alias: st

            Reduce Output Operator

              key expressions:

                    expr: name

                    type: string

              sort order: +

              Map-reduce partition columns:

                    expr: name

                    type: string

              tag:

      Reduce Operator Tree: “reduce job开始”

        Join Operator

          condition map:

               Left Outer Join0 to 1 “tag 0 out join tag 1”

          condition expressions: “这里也是描述select 后的列，和join没有关系。这里我们的select后的列是 s.id 和 s.name, 所以0后面有两个字段， 1后面没有”

             {VALUE._col0} {VALUE._col2} 

          handleSkewJoin: false

          outputColumnNames: _col0, _col2

          Select Operator

            expressions:

                  expr: _col0

                  type: int

                  expr: _col2

                  type: string

            outputColumnNames: _col0, _col1

            File Output Operator

              compressed: false

              GlobalTableId:

              table:

                  input format: org.apache.hadoop.mapred.TextInputFormat

                  output format: org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat

  Stage: Stage-

    Fetch Operator

      limit: -

Time taken: 0.216 seconds

Hive 执行计划的更多相关文章

hive执行计划简单分析
原始SQL: select a2.ISSUE_CODE as ISSUE_CODE, a2.FZQDM as FZQDM, a2.FZQLB as FZQLB, a2.FJJDM as FJJDM, ...
【转】Hive执行计划
执行语句 hive> explain select s.id, s.name from student s left outer join student_tmp st on s.name = ...
hive高阶1--sql和hive语句执行顺序、explain查看执行计划、group by生成MR
hive语句执行顺序 msyql语句执行顺序代码写的顺序: select ... from... where.... group by... having... order by.. 或者 from ...
hive sql 语句执行顺序及执行计划
hive 语句执行顺序 from... where.... select...group by... having ... order by... 执行计划 Map Operator Tree: Ta ...
Hive之执行计划分析(explain)
Hive是通过把sql转换成对应mapreduce程序,然后提交到Hadoop上执行,查看具体的执行计划可以通过执行explain sql知晓一条sql会被转化成由多个阶段组成的步骤,每个步骤有执行 ...
Hive底层原理：explain执行计划详解
不懂hive中的explain,说明hive还没入门,学会explain,能够给我们工作中使用hive带来极大的便利! 理论本节将介绍 explain 的用法及参数介绍 HIVE提供了EXPLAIN ...
Hive 执行作业时报错 [ Diagnostics: File file:/ *** reduce.xml does not exist FileNotFoundException: File file:/ ]
2019-03-10 本篇文章旨在阐述本人在某一特定情况下遇到 Hive 执行 MapReduce 作业的问题的探索过程与解决方案.不对文章的完全.绝对正确性负责. 解决方案 Hive 的配置文件 ...
Hive学习之路（二十）Hive 执行过程实例分析
一.Hive 执行过程概述 1.概述 (1) Hive 将 HQL 转换成一组操作符(Operator),比如 GroupByOperator, JoinOperator 等 (2)操作符 Opera ...
Hive（九）Hive 执行过程实例分析
一.Hive 执行过程概述 1.概述 (1) Hive 将 HQL 转换成一组操作符(Operator),比如 GroupByOperator, JoinOperator 等 (2)操作符 Opera ...

随机推荐

Github官方app的账户身份验证的实现
作为github上被fork最多,被star最多的Android项目,实在是没有理由不让我去学习学习的.这篇文章是关于其账户身份验证模块的实现的.如果你对此有兴趣,请移步到我的blog,地址如下: 地 ...
Android开发效率的小技巧
提高eclipse使用效率(二) 提高Android开发效率的小技巧 XML文件的代码提示 adt中也有xml文件的代码提示,为了让提示来的更加猛烈,我们还要设置一下打开eclipse - Wi ...
asp.net缓存(转载）
由于工作的需要,最近对.net缓存做了相关了解和学习.做以下分类: 客户端缓存第三方的缓存服务器缓存客户端缓存客户端缓存主要是指浏览器帮我们缓存一些页面组件包括脚本,样式,图片等等,由于客户端 ...
基于 WebSocket 构建跨浏览器的实时应用
Socket.IO – 基于 WebSocket 构建跨浏览器的实时应用 Socket.IO 是一个功能非常强大的框架,能够帮助你构建基于 WebSocket 的跨浏览器的实时应用.支持主流浏览器,多 ...
No object in the CompoundRoot has a publicly accessible property named
No object in the CompoundRoot has a publicly accessible property named 'typeid' (no setter could be ...
最近对Memcache的一些学习
首先,Memcache是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载.它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提供动态.数据库驱动网站的速度,再特别强调下:M ...
npm 安装与常用命令
下载nodejs并安装,会附带安装npm工具https://nodejs.org/en/download/ npm 常用命令#在执行命令时需要管理员权限,mac请用sudo来执行,windows请使用 ...
resin-pro-4.0.34 服務器在windows环境下的配置
resin-pro-4.0.34 服務器在windows环境下的配置(轉載请注明作者:icelong) 到caucho網站上http://www.caucho.com/download/下載resin ...
VS XCOPY
有时在项目开发过程中,某个项目不直接依赖于另外一个项目,也就是说在编码上不需要使用另外一个项目上的代码,但实际运行的时候需要用到,我们通常的做法是把另外项目中需要用到的DLL拷过来放到该项目的BIN文 ...
opencv编程入门技巧
opencv编程入门技巧最近在项目中负责图像处理模块的编程工作,主要分为两个板块,一是视频图像去雾,二是可视.红外图像融合.为了提升开发效率,遂开始学习并使用opencv图像类库,效果很好的说~因为 ...

Hive 执行计划

Hive 执行计划的更多相关文章

随机推荐

热门专题