Hive: Reflect UDF

Reflect UDF

JAVA类和方法通常用于处理用户希望在hive中使用的确切的函数。相比与封装一个UDF然后调用这个方法，这些

方法主要通过反射UDF去调用。Reflect使用Java反射去实例化，

  并且调用对象的方法；也能够调用静态方法。这个方法必须返回一个基础类或者一个hive能序列化的类。

  SELECT reflect("java.lang.String", "valueOf", 1),

       reflect("java.lang.String", "isEmpty"),

       reflect("java.lang.Math", "max", 2, 3),

       reflect("java.lang.Math", "min", 2, 3),

       reflect("java.lang.Math", "round", 2.5),

       reflect("java.lang.Math", "exp", 1.0),

       reflect("java.lang.Math", "floor", 1.9)

  FROM src LIMIT 1;

  结果：

  1   true    3   2   3   2.7182818284590455  1.0

  注意:

    1. 0.9.0采用了java_method()

    2. Reflect UDF是不确定返回值的。它不能保证在给予相同的参数时，返回值。因此小心在where子句中使用,因为会使谓词下推失败

谓词下推

谓词下推的基本思想：尽可能早的处理表达式(expressions)，默认产生的执行计划在看到数据的地方添加过滤

器filter，但是有些情况过滤filter表达式expressions被推到离第一次看到数据的操作operator更近。

如，select a.*, b.* from a join b on (a.col1 = b.col1) where a.col1 > 20 and b.col2 > 40(个人理解，where后面的句子为谓词，)

当没有谓词下推时，执行的顺序是

a join b , 然后再 filter

使用谓词下推时，执行的顺序是

a b 先进行过滤，然后再进行 join操作

开启谓词下推功能

set hive.optimize.ppd=true

参考官方文档：https://cwiki.apache.org/confluence/display/Hive/ReflectUDF

Hive: Reflect UDF的更多相关文章

Hive 10、Hive的UDF、UDAF、UDTF
Hive自定义函数包括三种UDF.UDAF.UDTF UDF(User-Defined-Function) 一进一出 UDAF(User- Defined Aggregation Funcation) ...
hive premanent udf 发布...
起因: hive premanent udf 发布成功,但是hue 无法加载使用(但是cli 是可用的) ,处理半天,依然不可用!后来发现重启hiveserver2 就可以了具体步骤如下: ...
hive中UDF、UDAF和UDTF使用
Hive进行UDF开发十分简单,此处所说UDF为Temporary的function,所以需要hive版本在0.4.0以上才可以. 一.背景:Hive是基于Hadoop中的MapReduce,提供HQ ...
hive下UDF函数的使用
1.编写函数 [java] view plaincopyprint?package com.example.hive.udf; import org.apache.hadoop.hive.ql. ...
在hive中UDF和UDAF使用说明
Hive进行UDF开发十分简单,此处所说UDF为Temporary的function,所以需要hive版本在0.4.0以上才可以. 一.背景:Hive是基于Hadoop中的MapReduce,提供HQ ...
【转】hive中UDF、UDAF和UDTF使用
原博文出自于: http://blog.csdn.net/liuj2511981/article/details/8523084 感谢! Hive进行UDF开发十分简单,此处所说UDF为Tempora ...
hive的UDF读取配置文件
hive的UDF读取配置文件实现步骤在读取配置文件的写为./file_name,然后在添加UDF的时候把配置文件也加入资源就好了: add jar xxx.jar; add file file_n ...
hive添加UDF
hive添加UDF 步骤如下: 函数分为永久和临时函数,后者会话退出则消失,前者不会查看已有函数(创建好后也可以通过这个来查看是否成功) show functions; 写UDF的java文件,如: ...
Impala 加载Hive的UDF
Impala的UDF有两种: Native Imapal UDF:使用C++开发的,性能极高,官方性能测试比第二种高出将近10倍 Hive的UDF:是Hive中的UDF,直接加载到Impala中,优点 ...

随机推荐

在flask中使用flask-migrate管理数据库
Flask-Migrate是一个为Flask应用处理SQLAlchemy数据库迁移的扩展,使得可以通过Flask的命令行接口或者Flask-Scripts对数据库进行操作. 安装 pip3 insta ...
Integer和Long部分源码分析
Integer和Long的java中使用特别广泛,本人主要一下Integer.toString(int i)和Long.toString(long i)方法,其他方法都比较容易理解. Integer. ...
bzoj3374[Usaco2004 Mar]Special Serial Numbers 特殊编号*
bzoj3374[Usaco2004 Mar]Special Serial Numbers 特殊编号题意: 求比一个数大的最小的一半以上的数位相同的数.数位数≤100. 题解: 模拟题.从低位枚举到 ...
sql多表语句
多条件查询条件判空最优写法 3三表带条件查询
java中同步异步阻塞和非阻塞的区别
同步所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回. 按照这个定义,其实绝大多数函数都是同步调用(例如sin, isdigit等).但是一般而言,我们在说同步.异步的时候,特 ...
Mobilenet V1
目录 1. Depth Separable Convolution 2. 网络结构 3. 宽度因子和分辨率因子 4. 代码实现参考博客: https://cuijiahua.com/blog/201 ...
html命名规则
CSS样式命名外套 wrap ------------------用于最外层头部 header ----------------用于头部主要内容 main ------------用于主体内容( ...
高效C++：模板和泛型编程
模板和泛型编程的关注重点在编译期,所有的行为都在编译期确定,因此其规则和玩法也有自己特殊的一套,和其他模块不通用. 了解隐式接口和编译期多态元编程------编译器多态,决定哪个重载函数被调用 cl ...
Hadoop之HDFS常用文件操作命令
命令基本格式:hadoop fs -cmd < args > 1. ls 列出hdfs文件系统根目录下的目录和文件hadoop fs -ls /dirhadoop fs -ls -R /d ...
hostapd阅读（openwrt）-3
从官网下载相对而言比较干净的源码版本http://w1.fi/hostapd/,然后将其移植到openwrt下,方便在源码阅读时候进行调试编译,移植的过程总结如下心得. 1. openwrt编译与cl ...

Hive: Reflect UDF

Reflect UDF

谓词下推

Hive: Reflect UDF的更多相关文章

随机推荐

热门专题