参考地址:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF

  1. parse_url(url, partToExtract[, key])

解析URL字符串,partToExtract的选项包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]
eg:
 
 
 
 

2. concat(str1,SEP,str2,SEP,str3,……) 和 concat_ws(SEP,str1,str2,str3, ……)

字符串连接函数,需要是 string型字段。

如果4个字段,想得到如下结果,看下两个函数的区别:

eg: 

代码1: select concat('江苏省','-','南京市','-','玄武区','-','徐庄软件园');

代码2: select concat_ws('-','江苏省','南京市','玄武区','徐庄软件园');

结论:当连接的内容(字段)多于2个的时候,concat_ws的优势就显现了,写法简单、方便。

  3. unix_timestamp() 当前系统时间

unix_timestamp() 是将当前系统时间转换成数字型秒数,from_unixtime 将数字型按照 格式进行时间转换。

eg:

代码:select from_unixtime(unix_timestamp(),'yyyy-MM-dd HH:mm:ss');

  4. regexp_replace(string A, string B, string C) 字符串替换函数,将字符串A 中的B 用 C 替换。

eg: 

代码:select regexp_replace('www.tuniu.com','tuniu','jd');

  5. repeat(string str, int n) 重复N次字符串

eg:

代码:select repeat('ab',3);

  6. lpad(string str, int len, string pad) 将字符串str 用pad进行左补足 到len位(如果位数不足的话)

eg:

代码:select lpad('ab',7,'k');

  7. rpad(string str, int len, string pad) 将字符串str 用pad进行右补足 到len位(如果位数不足的话)

eg:

代码:select rpad('ab',7,'k');

  8. trim(string A) 删除字符串两边的空格,中间的会保留。

相应的 ltrim(string A) ,rtrim(string A)

eg:

  9. to_date(string timestamp) 将时间戳转换成日期型字符串

eg:

代码:select to_date('2017-01-16 09:55:54');

  10. datediff(string enddate, string startdate) 返回int 的两个日期差

eg:

代码:select datediff('2017-01-16', '2017-01-10');

  11. date_add(string startdate, int days) 日期加减

eg:

代码:select date_add('2017-01-10', 7);

  12. current_timestamp 和 current_date 返回当前时间戳,当前日期

eg:

  13. date_format(date/timestamp/string ts, string fmt) 按照格式返回字符串

eg: 

代码:select date_format('2017-01-16 09:55:54', 'yyyy-MM-dd');

  14. last_day(string date) 返回 当前时间的月末日期

eg:

代码:select last_day('2017-01-16 09:55:54');

  15. if(boolean testCondition, T valueTrue, T valueFalseOrNull) ,根据条件返回不同的值

eg: 

  16. nvl(T value, T default_value) 如果T is null ,返回默认值

  17. length(string A) 返回字符串A的长度

eg:

代码:select length('kimbo');

  18. greatest(T v1, T v2, ...) 返回最大值,会过滤null

eg:

代码:select greatest('2016-01-01',NULL,'2017-01-01');

  19. least(T v1, T v2, ...) 返回最小值,会过滤null

eg: 

代码:select least('2016-01-01',NULL,'2017-01-01','2015-01-01');

  20. rand(), 返回0-1的随机值。rand(INT seed) 返回固定的随机值。

eg:

  21. md5(string/binary)  hive 1.3以上版本,返回md5码

  22. split(str, regex) ,安装规则截取字符串,返回数组

eg:

代码:select split('ab-cd','-')[0];

Hive 常用函数的更多相关文章

  1. Hive常用函数的使用

    Hive常用函数的使用 文章作者:foochane  原文链接:https://foochane.cn/article/2019062501.html 1 基本介绍 1.1 HIVE简单介绍 Hive ...

  2. hive常用函数 wordCount--Hive窗口函数1.1.1 聚合开窗函数聚合开窗函数实战

    第三天笔记 第三天笔记 SQL练习Hive 常用函数关系运算数值计算条件函数日期函数重点!!!字符串函数Hive 中的wordCount1.1 Hive窗口函数1.1.1 聚合开窗函数聚合开窗函数实战 ...

  3. Hive常用函数

    字符串函数 字符串长度函数:length 语法: length(string A) 返回值: int 说明:返回字符串A的长度 举例: hive> select length(‘abcedfg’ ...

  4. orcale和hive常用函数对照表(?代表未证实)

    函数分类 oracle hive 说明 字符函数 upper('coolszy') upper(string A) ucase(string A) 将文本字符串转换成字母全部大写形式 lower('K ...

  5. Hive 常用函数汇总

    Hive内部提供了很多函数给开发者使用,包括数学函数,类型转换函数,条件函数,字符函数,聚合函数,表生成函数等等,这些函数都统称为内置函数. 目录 数学函数 集合函数 类型转换函数 日期函数 条件函数 ...

  6. hive常用函数六

    cast 函数: 类型转换函数,cast(kbcount as int); case when: 条件判断,case when kbcount is not null and cast(kbcount ...

  7. hive常用函数五

    复合类型构建操作 1. Map类型构建: map 语法: map (key1, value1, key2, value2, …) 说明:根据输入的key和value对构建map类型 举例: hive& ...

  8. hive常用函数四

    字符串函数 1. 字符串长度函数:length 语法: length(string A) 返回值: int 说明:返回字符串A的长度 举例: hive> select length('abced ...

  9. hive常用函数三

    日期函数 1. UNIX时间戳转日期函数: from_unixtime 语法: from_unixtime(bigint unixtime[, string format]) 返回值: string ...

随机推荐

  1. 飘逸的python - zlib压缩存到数据库

    当每天有大量的数据存到kv数据库中去,且value数据很大,于是想压缩后再存进去. 之前提到了 gzip压缩,为什么不直接用gzip呢. 其实更确切的说gzip是一种文件格式,它压缩成gzip文件,而 ...

  2. python supervisor demo deployment

    I did a demo about how to deploy other python apps served by a 'supervisord' daemon processor on git ...

  3. VMware vSphere 服务器虚拟化之二十 桌面虚拟化之准备虚拟桌面模版

    VMware vSphere服务器虚拟化之二十 桌面虚拟化之准备虚拟桌面模版 在虚拟桌面的部署中,我们必须准备好作为桌面模板的父映像,通过父映像使用完整克隆或者View Composer的链接克隆,创 ...

  4. 程序集和反射(C#)

    这里我又唠叨几句,大家在学习的时候,如看书或者看视频时觉得非常爽,因为感觉基本都看得懂也都挺容易的,其实看懂是一回事,你自己会动手做出来是一回事,自己能够说出来又是另一回事了.应该把学到的东西变成自己 ...

  5. 浅谈Web前端浏览器兼容问题

    对于兼容最近一直困扰我,以前写的代码只是针对高质量用户来使用 不考虑IE7,8 这样的浏览器 ,但是最近我开发的时候必须要兼容,大喊一声我曹,没有办法,自己来吧! 所谓的浏览器兼容性问题,是指因为不同 ...

  6. windows全系列激活脚本-改良版.cmd

    @ECHO OFFTITLE Windows 全版本系统激活cscript //nologo %Systemroot%\system32\slmgr.vbs -skms 10.1.1.12ECHO 检 ...

  7. eclipse安装

    1.下载破解版本 地址:http://www.oyksoft.com/soft/1250.html 2.解压下载包,直接运行eclipse.exe  3.安装过程中如果遇到问题 1).如果遇到erro ...

  8. atnodes命令+sort+uniq统计特征信息到结果文件

    atnodes 'zgrep -oE "保单号重复" log.2016-10-23*.gz log.2016-10-24*.gz log.2016-10-25-*gz | grep ...

  9. webpack学习笔记—webpack安装、基本配置

    文章结构: 什么是webpack? 安装webpack 'webpack基本配置 一.什么是webpack? 在学习react时发现大部分文章都是react和webpack结合使用的,所以在学reac ...

  10. Linux网络常用头文件说明

    sys/types.h:数据类型定义 sys/socket.h:提供socket函数及数据结构 netinet/in.h:定义数据结构sockaddr_in arpa/inet.h:提供IP地址转换函 ...