自定义UDF

1、编写udf类

package hive.udf;

import org.apache.hadoop.hive.ql.exec.Description;
import org.apache.hadoop.hive.ql.exec.UDF;

/**
 * UDF的说明文档
 * name是UDF的名称
 * value是desc function xx输出的内容 
 * extended是desc function extended xx输出的内容 
 *
 */
@Description(name="uppernum", 
	value="_FUNC_ the input is a num, the output is the UpperNum", 
	extended="Example:\n" + 
		"> select uppernum(1) from src \n")
public class UpperNumUDF extends UDF {

	/**
	 * UDF类需要自定义evaluate方法，可以重载多个
	 * 
	 * evaluate的参数、返回值必须是hive可以序列化的类型
	 * 
	 * 参数：
	 * 	1）可以是java基本类型、String
	 * 	2）可以是Text
	 * 	3）可以包含多个参数，参数类型也可以不同
	 * 	4）可以是List<?>。如果hive表字段是Array<?>类型的，则是List
	 * 
	 * 返回值：
	 * 	1）必须有返回值，可以为null
	 * 	2）返回值只能是java基本类型、String、Writable
	 * 
	 * 可以自定义 UDFMethodResolver来手动匹配方法的执行
	 * 
	 * @param num
	 * @return
	 */
	public String evaluate(int num) {
		String str = "ERROR";
		
		switch (num) {
		case 0:
			str = "零";
			break;
		case 1:
			str = "壹";
			break;
		case 2:
			str = "贰";
			break;
		case 3:
			str = "叁";
			break;
		case 4:
			str = "肆";
			break;
		case 5:
			str = "伍";
			break;
		default:
			break;
		}
		
		return str;
	}
	
	public String evaluate(String num) {
		int intnum = 100;
		try {
			intnum = Integer.parseInt(num);
		} catch (NumberFormatException e) {
		}
		return evaluate(intnum);
	}

}

2、打包类，将jar上传到hive所在机器上

3、启动hive，在hive会话里执行：

1）加载jar包

hive (test)> add jar ${env:HOME}/udf.jar;

ps：jar包路径没有引号

2）创建uppernum

hive (test)> create [temporary] function uppernum as 'hive.udf.UpperNumUDF';

ps：创建的function，在hive会话结束后将消失，可以在.hiverc里设置，来确保每次hive启动时都执行create。

3）使用uppernum

hive (test)> select uppernum(2) from dual;
OK
贰
Time taken: 0.118 seconds, Fetched: 1 row(s)
hive (test)> select uppernum(5) from dual;
OK
伍

4）查看uppernum的说明文档

hive (test)> desc function uppernum;
OK
uppernum the input is a num, the output is the UpperNum
Time taken: 0.138 seconds, Fetched: 1 row(s)

hive (test)> desc function extended uppernum;
OK
uppernum the input is a num, the output is the UpperNum
Example:
> select uppernum(1) from src 

Time taken: 0.138 seconds, Fetched: 4 row(s)

5）删除UDF

hive> drop [temporary] function uppernum;
OK
Time taken: 0.221 seconds

来自为知笔记(Wiz)

附件列表

自定义UDF的更多相关文章

Hive UDF IP解析（二）：使用geoip2数据库自定义UDF
开发中经常会碰到将IP转为地域的问题,所以以下记录Hive中自定义UDF来解析IP. 使用到的地域库位maxmind公司的geoIP2数据库,分为免费版GeoLite2-City.mmdb和收费版Ge ...
自定义udf添加一列
//创建得分窗口字典 var dict= new mutable.HashMap[Double, Int]() ){ dict.put(result_Score(i),i) } //自定义Udf函数 ...
2.13 Hive中自带Function使用及自定义UDF编程
UDF:User Definition Function 一.function #查看自带的函数 hive (db_hive)> show functions; #查看一个函数的详细用法 hiv ...
自定义UDF函数应用异常
自定义UDF函数应用异常版权声明:本文为yunshuxueyuan原创文章.如需转载请标明出处: http://www.cnblogs.com/sxt-zkys/QQ技术交流群:299142667 ...
如何给Apache Pig自定义UDF函数？
近日由于工作所需,需要使用到Pig来分析线上的搜索日志数据,散仙本打算使用hive来分析的,但由于种种原因,没有用成,而Pig(pig0.12-cdh)散仙一直没有接触过,所以只能临阵磨枪了,花了两天 ...
Hive 自定义UDF操作步骤
Hive 自定义UDF操作步骤需要自定义类,然后继承UDF 然后在方法envluate()方法里面实现具体的业务逻辑,打包上传到linux(以免出错打包成RunningJar) 一.创建临时函数 ( ...
【Spark篇】---SparkSQL中自定义UDF和UDAF，开窗函数的应用
一.前述 SparkSQL中的UDF相当于是1进1出,UDAF相当于是多进一出,类似于聚合函数. 开窗函数一般分组取topn时常用. 二.UDF和UDAF函数 1.UDF函数 java代码: Spar ...
047 SparkSQL自定义UDF函数
一:程序部分 1.需求 Double数据类型格式化,可以给定小数点位数 2.程序 package com.scala.it import org.apache.spark.{SparkConf, Sp ...
Spark(十三)【SparkSQL自定义UDF/UDAF函数】
目录一.UDF(一进一出) 二.UDAF(多近一出) spark2.X 实现方式案例 ①继承UserDefinedAggregateFunction,实现其中的方法 ②创建函数对象,注册函数,在s ...

随机推荐

c++的动态绑定和静态绑定
为了支持c++的多态性,才用了动态绑定和静态绑定. 1.对象的静态类型:对象在声明时采用的类型.是在编译期确定的. 2.对象的动态类型:目前所指对象的声明.在运行期决定.对象的动态类型可以更改,但是静 ...
FineBI学习系列之FineBI的ETL处理（图文详解）
不多说,直接上干货! 这是来自FineBI官网提供的帮助文档 http://help.finebi.com/http://help.finebi.com/doc-view-48.html 目录: 1. ...
getFields和getDeclaredFields
getFields()获得某个类的所有的公共(public)的字段,包括父类. getDeclaredFields()获得某个类的所有申明的字段,即包括public.private和proteced, ...
mpvue使用scroll-view实现图片横向滑动
html代码 <div class="swiper-home"> <scroll-view scroll-x="true" style=&qu ...
spring boot 与 thymeleaf (3): 设置属性、条件、遍历、局部变量、优先级、内联语法
前面记录了 thymeleaf 基本表达式, 这里继续看一下其他功能. 一. 设置属性值这里的controller, html框架还是沿用上一篇的部分. html: <div class=& ...
NHibernate with ASP.NET MVC 入门示例
目的:初步了解NHibernate的用法,包括数据库的CRUD, 基于ASP.NET MVC 项目模板步骤: 创建ASP.NET MVC 新项目使用NuGet引入FluentNHibernate ...
JavaScript 内存泄露以及如何处理
一.前言一直有打算总结一下JS内存泄露的方面的知识的想法,但是总是懒得提笔. 富兰克林曾经说过:懒惰,像生鏽一样,比操劳更能消耗身体,经常用的钥匙总是亮闪闪的.安利一下,先起个头. 二.内存声明周期 ...
javascript 创建对象方式
本文主要是对<JavaScript高级程序设计>第六章(面向对象的程序设计)的总结,书上的这章至少看了4遍是有的.该章主要讲对象的创建与继承.其中创建对象和继承方式至少6种,再加上一些方法 ...
ZOJ Problem Set - 3878 Convert QWERTY to Dvorak
题目链接: http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=3878 /* 问题很有意思的一道题目,纯模拟,注意细节和最后一 ...
HDU 1576 A/B(欧几里德算法延伸)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1576 题目: Problem Description 要求(A/B)%9973,但由于A很大,我们只 ...

自定义UDF

附件列表

自定义UDF的更多相关文章

随机推荐

热门专题