利用hive源码解析sql查了哪些表哪些字段

在hiveserver2中使用了org.apache.hadoop.hive.ql.parse.BaseSemanticAnalyzer对抽象语法树（AST）进行语义分析，分析的过程可以得出hive查询的表及其字段

于是我利用相关的类去做测试：

package com.baidu.waimai;

import org.apache.hadoop.hive.conf.HiveConf;

import org.apache.hadoop.hive.ql.Context;

import org.apache.hadoop.hive.ql.parse.*;

import org.apache.hadoop.hive.ql.session.SessionState;

public class TestHiveParser {

    public static void main(String[] args) throws Throwable {

//        String sql = "select * from (select name from test.test1 where id = 1) a";

        String sql = "select * from test.test1";

        HiveConf hiveConf = new HiveConf();

        hiveConf.set("hive.stats.collect.tablekeys", "true");

        hiveConf.set("hive.stats.collect.scancols", "true");

        SessionState sessionState = SessionState.start(hiveConf);

        sessionState.initTxnMgr(hiveConf);

        SessionState.setCurrentSessionState(sessionState);

        Context ctx = new Context(hiveConf);

        ctx.setTryCount(Integer.MAX_VALUE);

        ctx.setCmd(sql);

        ctx.setHDFSCleanup(true);

        ParseDriver pd = new ParseDriver();

        ASTNode tree = pd.parse(sql);

        tree = ParseUtils.findRootNonNullToken(tree);

        System.out.println(tree);

        BaseSemanticAnalyzer baseSemanticAnalyzer = SemanticAnalyzerFactory.get(hiveConf, tree);

        System.out.println(baseSemanticAnalyzer);

        baseSemanticAnalyzer.analyze(tree, ctx);

        TableAccessInfo tableAccessInfo = baseSemanticAnalyzer.getTableAccessInfo();

        System.out.println(tableAccessInfo);

        ColumnAccessInfo columnAccessInfo = baseSemanticAnalyzer.getColumnAccessInfo();

        System.out.println(columnAccessInfo);

        sessionState.close();

        ctx.clear();

    }

}

最后可以根据columnAccessInfo去得到查询的表及其字段。

但这么做不太满足我们的需求，比如说下面这句sql，我想要的结果是查询了test.test1表的name字段，但是它连id字段也拿出来了。

select * from (select name from test.test1 where id = 1) a

先记录一下，之后如果找到源码有解决方法的话再更新

利用hive源码解析sql查了哪些表哪些字段的更多相关文章

Hive源码解析
date: 2020-07-08 15:12:00 updated: 2020-08-21 17:38:00 Hive源码解析入口:hive-cli-1.1.0-cdh5.14.4.jar!/org ...
Spark SQL源码解析（五）SparkPlan准备和执行阶段
Spark SQL原理解析前言: Spark SQL源码剖析(一)SQL解析框架Catalyst流程概述 Spark SQL源码解析(二)Antlr4解析Sql并生成树 Spark SQL源码解析(三 ...
Spark SQL源码解析（三）Analysis阶段分析
Spark SQL原理解析前言: Spark SQL源码剖析(一)SQL解析框架Catalyst流程概述 Spark SQL源码解析(二)Antlr4解析Sql并生成树 Analysis阶段概述首先 ...
Spark SQL源码解析（四）Optimization和Physical Planning阶段解析
Spark SQL原理解析前言: Spark SQL源码剖析(一)SQL解析框架Catalyst流程概述 Spark SQL源码解析(二)Antlr4解析Sql并生成树 Spark SQL源码解析(三 ...
[源码解析] GroupReduce，GroupCombine 和 Flink SQL group by
[源码解析] GroupReduce,GroupCombine和Flink SQL group by 目录 [源码解析] GroupReduce,GroupCombine和Flink SQL grou ...
jQuery2.x源码解析(设计篇)
jQuery2.x源码解析(构建篇) jQuery2.x源码解析(设计篇) jQuery2.x源码解析(回调篇) jQuery2.x源码解析(缓存篇) 这一篇笔者主要以设计的角度探索jQuery的源代 ...
EventBus源码解析源码阅读记录
EventBus源码阅读记录 repo地址: greenrobot/EventBus EventBus的构造双重加锁的单例. static volatile EventBus defaultInst ...
【转】Java HashMap 源码解析（好文章）
.fluid-width-video-wrapper { width: 100%; position: relative; padding: 0; } .fluid-width-video-wra ...
给jdk写注释系列之jdk1.6容器(4)-HashMap源码解析
前面了解了jdk容器中的两种List,回忆一下怎么从list中取值(也就是做查询),是通过index索引位置对不对,由于存入list的元素时安装插入顺序存储的,所以index索引也就是插入的次序. M ...

随机推荐

POJ 2187 Beauty Contest（凸包求最远点对）
链接:传送门题意:给出 n 个点,求出这 n 个点中最远的两个点距离的平方思路:最远点对一定会在凸包的顶点上,然后直接暴力找一下凸包顶点中距离最远的两个点 /******************* ...
DDL表结构修改
*1)创建表 create table 表名( 字段名类型, .... ); //以现有表复制一个新表 create table j012 as se ...
java有参无参构造器的的执行顺序
这里拿了用数组构造栈的一段代码说明一下 public class StackArray<E> { private Object[] data = null; private int max ...
NHibernate3剖析：Mapping篇之集合映射基础(3):List映射
系列引入 NHibernate3.0剖析系列分别从Configuration篇.Mapping篇.Query篇.Session策略篇.应用篇等方面全面揭示NHibernate3.0新特性和应用及其各种 ...
MySQL优化之——集群搭建步骤具体解释
转载请注明出处:http://blog.csdn.net/l1028386804/article/details/46833179 1 概述 MySQL Cluster 是MySQL 适合于分布式计算 ...
[cocos2dx笔记013]一个使用CCRenderTexture创建动态纹理显示数字的类
用CCLabelTTF显示的数字不好看.于是就想到用图片来代理.眼下网上的实现都是把每一个数字做一个CCSprite组合的方式. 可是我想.动态生成纹理的方式.没有就仅仅好自己手动写一个. 头文件 # ...
[NOIP2017] 逛公园解题报告(DP)
我很不想说在我的AC代码上我打了表,但实在没有办法了.莫名的8,9个点RE.然而即便是打表...也花了我很久. 这大概是NOIP2017最难的题了,为了让不懂的人更容易理解,这篇题解会比较详细我的 ...
MYSQL主从复制搭建及切换操作（GTID与传统）
结构如下: MYSQL主从复制方式有默认的复制方式异步复制,5.5版本之后半同步复制,5.6版本之后新增GTID复制,包括5.7版本的多源复制. MYSQL版本:5.7.20 操作系统版本:linux ...
Scalable, Distributed Systems Using Akka, Spring Boot, DDD, and Java--转
原文地址:https://dzone.com/articles/scalable-distributed-systems-using-akka-spring-boot-ddd-and-java Whe ...
模仿百度首页“元宵节汤圆”动图，并实现360°不停旋转（CSS3的animation动画效果）
模仿百度首页“元宵节汤圆”动图,并实现360°不停旋转(CSS3的animation动画效果) 效果图: 切图地址: https://ss1.bdstatic.com/5eN1bjq8AAUYm2zg ...

利用hive源码解析sql查了哪些表哪些字段

利用hive源码解析sql查了哪些表哪些字段的更多相关文章

随机推荐

热门专题