hive添加UDF

步骤如下：

函数分为永久和临时函数，后者会话退出则消失，前者不会
查看已有函数（创建好后也可以通过这个来查看是否成功）

show functions;

写UDF的java文件，如：

/**

 * Licensed to the Apache Software Foundation (ASF) under one

 * or more contributor license agreements.  See the NOTICE file

 * distributed with this work for additional information

 * regarding copyright ownership.  The ASF licenses this file

 * to you under the Apache License, Version 2.0 (the

 * "License"); you may not use this file except in compliance

 * with the License.  You may obtain a copy of the License at

 *

 *     http://www.apache.org/licenses/LICENSE-2.0

 *

 * Unless required by applicable law or agreed to in writing, software

 * distributed under the License is distributed on an "AS IS" BASIS,

 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 * See the License for the specific language governing permissions and

 * limitations under the License.

 */

package org.apache.hadoop.hive.ql.udf;

import org.apache.hadoop.hive.ql.exec.UDF;

import org.apache.hadoop.hive.serde2.ByteStream;

import org.apache.hadoop.hive.serde2.io.ByteWritable;

import org.apache.hadoop.hive.serde2.io.DoubleWritable;

import org.apache.hadoop.hive.serde2.io.ShortWritable;

import org.apache.hadoop.hive.serde2.io.TimestampWritable;

import org.apache.hadoop.hive.serde2.lazy.LazyInteger;

import org.apache.hadoop.hive.serde2.lazy.LazyLong;

import org.apache.hadoop.io.BooleanWritable;

import org.apache.hadoop.io.BytesWritable;

import org.apache.hadoop.io.FloatWritable;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.NullWritable;

import org.apache.hadoop.io.Text;

/**

 * UDFToString.

 *

 */

public class UDFToString extends UDF {

  private final Text t = new Text();

  private final ByteStream.Output out = new ByteStream.Output();

  public UDFToString() {

  }

  public Text evaluate(NullWritable i) {

    return null;

  }

  private final byte[] trueBytes = {'T', 'R', 'U', 'E'};

  private final byte[] falseBytes = {'F', 'A', 'L', 'S', 'E'};

  public Text evaluate(BooleanWritable i) {

    if (i == null) {

      return null;

    } else {

      t.clear();

      t.set(i.get() ? trueBytes : falseBytes);

      return t;

    }

  }

  public Text evaluate(ByteWritable i) {

    if (i == null) {

      return null;

    } else {

      out.reset();

      LazyInteger.writeUTF8NoException(out, i.get());

      t.set(out.getData(), 0, out.getCount());

      return t;

    }

  }

  public Text evaluate(ShortWritable i) {

    if (i == null) {

      return null;

    } else {

      out.reset();

      LazyInteger.writeUTF8NoException(out, i.get());

      t.set(out.getData(), 0, out.getCount());

      return t;

    }

  }

  public Text evaluate(IntWritable i) {

    if (i == null) {

      return null;

    } else {

      out.reset();

      LazyInteger.writeUTF8NoException(out, i.get());

      t.set(out.getData(), 0, out.getCount());

      return t;

    }

  }

  public Text evaluate(LongWritable i) {

    if (i == null) {

      return null;

    } else {

      out.reset();

      LazyLong.writeUTF8NoException(out, i.get());

      t.set(out.getData(), 0, out.getCount());

      return t;

    }

  }

  public Text evaluate(FloatWritable i) {

    if (i == null) {

      return null;

    } else {

      t.set(i.toString());

      return t;

    }

  }

  public Text evaluate(DoubleWritable i) {

    if (i == null) {

      return null;

    } else {

      t.set(i.toString());

      return t;

    }

  }

  public Text evaluate(Text i) {

      if (i == null) {

          return null;

      }

      i.set(i.toString());

      return i;

  }

  public Text evaluate(TimestampWritable i) {

    if (i == null) {

      return null;

    } else {

      t.set(i.toString());

      return t;

    }

  }

  public Text evaluate (BytesWritable bw) {

    if (null == bw) {

      return null;

}

    t.set(bw.getBytes(),0,bw.getLength());

    return t;

  }

}

将写好的java文件打包成jar：

jar cvf UDFUpper.jar -c bin UDFUpper.java

进入hive，添加jar文件

hive> add jar UDFToString.jar;

Added [UDFToString.jar] to class path

Added resources: [UDFToString.jar]

添加临时函数（会话结束函数消失）

进入hive，添加jar文件

hive> add jar UDFToString.jar;

Added [UDFToString.jar] to class path

Added resources: [UDFToString.jar]

添加函数(注意class所在包)

语法为：

CREATE TEMPORARY FUNCTION function_name AS class_name;

hive> create temporary function mytest as 'org.apache.hadoop.hive.ql.udf.UDFToString';

OK

Time taken: 0.009 seconds

路径出错会提示：

FAILED: Class default.udf.Upper not found

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.FunctionTask

具体类路径为UDF java文件里的package+'.'+java文件名

删除临时函数

DROP TEMPORARY FUNCTION [IF EXISTS] function_name;

添加永久函数

添加

语法：

CREATE FUNCTION [db_name.]function_name AS class_name

  [USING JAR|FILE|ARCHIVE 'file_uri' [, JAR|FILE|ARCHIVE 'file_uri'] ];

注意：

如果hive非本地模式运行，则后面应该是为非本地文件等URI，如hdfs路径，否则会报错；

例子：

hive> create function default.hah as "org.apache.hadoop.hive.ql.udf.UDFToString" using jar "UDFToString.jar";

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.FunctionTask. Hive warehouse is non-local, but UDFToString.jar specifies file on local filesystem. Resources on non-local warehouse should specify a non-local scheme/path

hive> create function default.hah as "org.apache.hadoop.hive.ql.udf.UDFToString" using jar "hdfs:///hdfs_home/UDFToString.jar";

converting to local hdfs:///hdfs_home/UDFToString.jar

Added [/tmp/fda83e6d-e1af-4005-affa-9f9c4ee226a6_resources/UDFToString.jar] to class path

Added resources: [hdfs:///hdfs_home/UDFToString.jar]

OK

Time taken: 0.521 seconds

删除

DROP FUNCTION [IF EXISTS] function_name;

引用第三方包的情况

假如在你的UDF文件里引用了第三方包，那么只需要在生成jar文件的时候改变一下命令就可以了，如下：

javac -classpath hive-0.4.1.jar:commons-io-2.5.jar:bcprov-jdk15on-158.jar  com/example/hive/udf/UDFDecrypt.java

jar -cvf UDFDecrypt.jar ./com/example/hive/udf/UDFDecrypt.class

上面javac命令中classpath跟的是用到的第三方包名，使用：做间隔，后面跟的是java文件路径

此处参考了这里

参考

更多实例见这里
http://blog.csdn.net/yfkiss/article/details/7885262
官方文档
打包
打包的时候缺失的文件可以来这里下载
cajeep的专栏

hive添加UDF的更多相关文章

hive 添加UDF(user define function) hive的insert语句
add JAR /home/hadoop/study/study2/utf.jar; package my.bigdata.udf; import org.apache.hadoop.hive.ql. ...
Hive 10、Hive的UDF、UDAF、UDTF
Hive自定义函数包括三种UDF.UDAF.UDTF UDF(User-Defined-Function) 一进一出 UDAF(User- Defined Aggregation Funcation) ...
hive中UDF、UDAF和UDTF使用
Hive进行UDF开发十分简单,此处所说UDF为Temporary的function,所以需要hive版本在0.4.0以上才可以. 一.背景:Hive是基于Hadoop中的MapReduce,提供HQ ...
hive下UDF函数的使用
1.编写函数 [java] view plaincopyprint?package com.example.hive.udf; import org.apache.hadoop.hive.ql. ...
在hive中UDF和UDAF使用说明
Hive进行UDF开发十分简单,此处所说UDF为Temporary的function,所以需要hive版本在0.4.0以上才可以. 一.背景:Hive是基于Hadoop中的MapReduce,提供HQ ...
【转】hive中UDF、UDAF和UDTF使用
原博文出自于: http://blog.csdn.net/liuj2511981/article/details/8523084 感谢! Hive进行UDF开发十分简单,此处所说UDF为Tempora ...
hive的UDF读取配置文件
hive的UDF读取配置文件实现步骤在读取配置文件的写为./file_name,然后在添加UDF的时候把配置文件也加入资源就好了: add jar xxx.jar; add file file_n ...
【Hive五】Hive函数UDF
Hive函数系统自带的函数查看系统自带的函数查看系统自带的函数 show functions; 显示自带的函数的用法 desc function upper; 详细显示自带的函数的用法 desc ...
hive premanent udf 发布...
起因: hive premanent udf 发布成功,但是hue 无法加载使用(但是cli 是可用的) ,处理半天,依然不可用!后来发现重启hiveserver2 就可以了具体步骤如下: ...

随机推荐

iOS如何在iTunes网站查看并下载APP的dsym文件
有时需要拿到app的dsym符号表文件,恰巧本地的构建版本文件已经不在了,那么我们还可以在iTunes那边获取到. 步骤不复杂: 1.登陆itunes网站 https://itunesconnect. ...
JavaScript Window History 浏览器的历史
window.history 对象在编写时可不使用 window 这个前缀. 为了保护用户隐私,对 JavaScript 访问该对象的方法做出了限制. 一些方法: history.back() - 与 ...
进阶之路（基础篇） - 010 Arduino 函数（基本、串口、SPI）
一．基本函数 pinMode(引脚号,模式); digitalWrite(引脚号,电平状态); //默认低电平(或浮空) digitalRead(数字输入端口号); analogRe ...
浅谈 .NET 中的对象引用、非托管指针和托管指针理解C#中的闭包
浅谈 .NET 中的对象引用.非托管指针和托管指针目录前言一.对象引用二.值传递和引用传递三.初识托管指针和非托管指针四.非托管指针 1.非托管指针不能指向对象引用 2.类成员指针五 ...
Java 垃圾回收思维导图
文 by / 林本托 Tips 做一个终身学习的人. Java 的垃圾回收,不像 C和 C++语言,内存的分配和释放都是靠程序员来控制的.而 Java 的内存回收,程序员是不能也是无法干预,具体什么时 ...
html input控件总结
Input表示Form表单中的一种输入对象,其又随Type类型的不同而分文本输入框,密码输入框,单选/复选框,提交/重置按钮等,下面一一介绍. 1,type=text 输入类型是text,这是我们见的 ...
关于thymeleaf+layout布局的使用方式，spring boot 访问页面（静态页面及jsp页面）
首先建立相同部分的html,这里我命名为layout.html,放在了`templates/layout'文件夹下,这个路径以后是会用到的,以下是我的layout的代码,比较粗糙. 但是应该会更好的帮 ...
mysql错误号代表的含义
1005:创建表失败1006:创建数据库失败1007:数据库已存在,创建数据库失败1008:数据库不存在,删除数据库失败1009:不能删除数据库文件导致删除数据库失败1010:不能删除数据目录导致删除 ...
Python MySQLdb 批量插入封装
def insert_data_many(dbName,list_data_dict): try: # 得到列表的第一个字典集合 data_dict = list_data_dict[0] # 得到( ...
python标准库介绍——29 zlib 模块详解
==zlib 模块== (可选) ``zlib`` 模块为 "zlib" 压缩提供支持. (这种压缩方法是 "deflate".) [Example 2-43 ...

hive添加UDF

hive添加UDF

步骤如下：

引用第三方包的情况

参考

hive添加UDF的更多相关文章

随机推荐

热门专题