HIVE udf实例

本例中udf来自《hive编程指南》其中13章自定义函数中一个例子。

按照步骤，第一步，建立一个项目，创建 GenericUDFNvl 类。

/**

 * 不能接受第一个参数为null的情况
 * 测试过，不是很好用

 */

package hive.udf;

import org.apache.hadoop.hive.ql.exec.Description;

import org.apache.hadoop.hive.ql.exec.UDFArgumentException;

import org.apache.hadoop.hive.ql.exec.UDFArgumentLengthException;

import org.apache.hadoop.hive.ql.exec.UDFArgumentTypeException;

import org.apache.hadoop.hive.ql.metadata.HiveException;

import org.apache.hadoop.hive.ql.udf.generic.GenericUDF;

import org.apache.hadoop.hive.ql.udf.generic.GenericUDFUtils;

import org.apache.hadoop.hive.serde2.objectinspector.ObjectInspector;

@Description(

    name = "nvl",

    value = "_FUNC_(value,default_value) - Returns default value if value is nul else returns value",

    extended = "Example:\n> SELECT _FUNC_(NULL, 'bla') FROM src LIMIT 1;"

)

public class GenericUDFNvl extends GenericUDF {

    private GenericUDFUtils.ReturnObjectInspectorResolver returnOIResolver;

    private ObjectInspector[] argumentOIs;

    @Override

    public ObjectInspector initialize(ObjectInspector[] arguments) throws UDFArgumentException {

        argumentOIs = arguments;

        if (arguments.length != 2) {

            throw new UDFArgumentLengthException("The operator 'NVL' accepts 2 arguments.");

        }

        returnOIResolver = new GenericUDFUtils.ReturnObjectInspectorResolver(true);

        if (!(returnOIResolver.update(arguments[0]) && returnOIResolver.update(arguments[1]))) {

            throw new UDFArgumentTypeException(2,

                    "THe 1st and 2nd args of function NVL should have the same type, "

                    + "but they are different: \"" + arguments[0].getTypeName()

                    + "\" and \"" + arguments[1].getTypeName() + "\"");

        }

        return returnOIResolver.get();

    }

    @Override

    public Object evaluate(DeferredObject[] arguments) throws HiveException {

        Object retVal = returnOIResolver.convertIfNecessary("", argumentOIs[0]);

        //if (retVal == null) {

            retVal = returnOIResolver.convertIfNecessary(arguments[1], argumentOIs[1]);

        //}

        return retVal;

    }

    @Override

    public String getDisplayString(String[] children) {

        StringBuilder sb = new StringBuilder();

        sb.append("if ");

        sb.append(children[0]);

        sb.append(" is null ");

        sb.append("returns");

        sb.append(children[1]);

        return sb.toString();

    }

}

创建完成之后，在项目中点右键->Export->JAR file，再下一步中选中刚刚创建的这个文件，将文件导出为.jar文件。

接下来，进入hive的 CLI，执行

hive> add jar /home/user/udfnvl.jar;

hive> create temporary function nvl as "hive.udf.GenericUDFNvl";

hive> desc function nvl;
OK
nvl(value,default_value) - Returns default value if value is nul else returns value
Time taken: 0.169 seconds
hive> desc function extended nvl;
OK
nvl(value,default_value) - Returns default value if value is nul else returns value
Example:
> SELECT nvl(NULL, 'bla') FROM src LIMIT 1;

Time taken: 0.051 seconds

以上的整个过程比较简单，有很多UDF的例子，可以在github中找到，如https://github.com/apache/hive/blob/master/ql/src/java/org/apache/hadoop/hive/ql/udf/generic/GenericUDFEncode.java

但也有一些需要注意的地方，就是导出项目jar包时需要关注一下jdk的版本，需要与执行环境一致，否则会报 Unsupported major.minor version 52.0 这样的错误。

HIVE udf实例的更多相关文章

2、Hive UDF编程实例
Hive的UDF包括3种:UDF(User-Defined Function).UDAF(User-Defined Aggregate Function)和UDTF(User-Defined Tabl ...
如何编写自定义hive UDF函数
Hive可以允许用户编写自己定义的函数UDF,来在查询中使用.Hive中有3种UDF: UDF:操作单个数据行,产生单个数据行: UDAF:操作多个数据行,产生一个数据行. UDTF:操作一个数据行, ...
Hive UDF初探
1. 引言在前一篇中,解决了Hive表中复杂数据结构平铺化以导入Kylin的问题,但是平铺之后计算广告日志的曝光PV是翻倍的,因为一个用户对应于多个标签.所以,为了计算曝光PV,我们得另外创建视图. ...
Hive UDF开发实例学习
1. 本地环境配置必须包含的一些包. http://blog.csdn.net/azhao_dn/article/details/6981115 2. 去重UDF实例 http://blog.csd ...
Hive UDF 实验1
项目中使用的hive版本低于0.11,无法使用hive在0.11中新加的开窗分析函数. 在项目中需要使用到row_number()函数的地方,有人写了udf来实现这个功能. new java proj ...
hive UDF添加方式
hive UDF添加的方式 1.添加临时函数,只能在此会话中生效,退出hive自动失效 hive> add jar /home/jtdata/hiveUDF/out0.jar; Added [/ ...
DeveloperGuide Hive UDF
Creating Custom UDFs First, you need to create a new class that extends UDF, with one or more method ...
[转]HIVE UDF/UDAF/UDTF的Map Reduce代码框架模板
FROM : http://hugh-wangp.iteye.com/blog/1472371 自己写代码时候的利用到的模板 UDF步骤: 1.必须继承org.apache.hadoop.hive ...
Hive UDF 用户自定义函数编程及使用
首先创建工程编写UDF 代码,示例如下: 1. 新建Maven项目 udf 本机Hadoop版本为2.7.7, Hive版本为1.2.2,所以选择对应版本的jar ,其它版本也不影响编译. 2. po ...

随机推荐

JavaWeb_(SSH)三大框架整合struts+hibernate+spring_Demo
三大框架整合一.SSH导包二.书写Spring 三.书写Struts 四.整合Spring与Struts 五.书写(与整合)Hibernate.引入c3p0连接池并使用hibernate模板六. ...
在 Go 语言中使用 Session（一）
在上一篇博客理解Cookie和Session 中,我们了解了 Cookie 和 Session 的一些基础知识,也知道了 Session 的基本原理是由服务端保存一份状态信息(以及它的唯一标识符), ...
深入理解Java的三大特性之多态
世界上最美丽的东西,看不见也摸不着,要靠心灵去感受. ——海伦·凯勒面向对象编程有三大特性:封装.继承.多态. 封装隐藏了类的内部实现机制,可以在不影响类使用的情况下改变类的内部结构,并保护数据.对 ...
legend3---12、DB::table('user_questions')和UserQuestion查询的结果的格式不一样
legend3---12.DB::table('user_questions')和UserQuestion查询的结果的格式不一样一.总结一句话总结: 推荐使用模型查找的方式,可以直接数组方式访问: ...
Ubuntu 配置ISCSI服务
摘要:sudo apt-get install iscsitarget立刻搞定, 然后编辑配置文件:sudovim/etc/ietd.conf默认的配置文件, 有详细的配置说明和示例,本博先备份了事, ...
Elasticsearch6.5.1破解x-pack,设置密码并使用head插件登陆。
#没有许可证的es无法持久的设置密码,而且使用一段时间后会过期,过期后,一些功能无法被使用,例如head插件无法看到es状态. 下图是过期的es的状态,可通过此url查看:http://ip:port ...
ios-Runtime调用私有方法
有时在代码中会有需要调用私有方法的场景,如不想import太多头文件:想组件设计一些解耦的模块:查看别人模块中未暴露的代码进行分析等. 在 ios 中调用私有方法有很多种方式,主要是通过Runtime ...
06 MySQL之索引
01-索引 1.索引是对数据库表中一列或多列的值进行排序的一种数据结构,使用索引可提高数据库中特定数据的查询速度. 2.索引是一个单独的.存储在磁盘上的数据库结构,包含对数据表里所有记录的引用指针. ...
PHP批量写入数据、批量删除数据
批量插入可以参考$sql = "insert into data (id,ip,data) values ";for($i=0;$i<100;$i++){$sqls[]=& ...
syslog+rsyslog+logstash+elasticsearch+kibana搭建日志收集
最近rancher平台上docker日志收集捣腾挺久的,尤其在配置上,特写下记录 Unix/Linux系统中的大部分日志都是通过一种叫做syslog的机制产生和维护的.syslog是一种标准的协议,分 ...

HIVE udf实例

HIVE udf实例的更多相关文章

随机推荐

热门专题