【hive】关于浮点数比较的问题

当在hive中写下浮点数(例如:0.2)

hive会把浮点数(0.2)存储为double类型

但是系统中并不能精准表示0.2这个浮点数

正确的浮点数表示

float 0.2 —> 0.2000000

double 0.2 —> 0.200000000000

但是系统中表示为

float 0.2 —> 0.2000001

double 0.2 —> 0.200000000001

如果我们在hive中把 float(0.2)转化成为double(0.2)

实际上是 0.2000001 —> 0.200000100000

并不是 0.2000001 —> 0.200000000001

所以

float(0.2)转化的double(0.2) 是大于直接存储的double(0.2)

float类型和double类型相比较,hive中是自动把范围小的类型转化成为范围大的类型的,也就是float转化为doule

导致float转化成为的double类型的数字大于比较的double数字

所以我们在使用浮点数比较的时候,不要用hive的自动扩充精度来比较,尽量使用较小精度来比较.

也就是float和double比较的时候,把double cast( as float)才能显示正确结果.

示例:

TABLE table1

id (INT) ,taxes(float)

1 0.2

2 0.2

3 0.3

我们要找出大于0.2的id有哪些

select id,taxes from table1 where taxes > 0.2;

结果显示:

1 0.2

2 0.2

3 0.3

为什么会把0.2本身也显示呢?

因为hive把0.2存储为double类型,

0.2 —> 0.200000000001

而taxes为float类型

id (INT) ,taxes(float)

1 0.2 —> 0.2000001

2 0.2 —> 0.2000001

3 0.3 —> 0.3000001

当我们用float类型和double类型比较的时候

hive自动将taxes转化为double类型

id (INT) ,taxes(float) —> taxes(float_to_double)

1 0.2 —> 0.200000100000

2 0.2 —> 0.200000100000

3 0.3 —> 0.300000100000

所以实际上,float(0.2) —> float_to_double(0.2) > double(0.2)

怎么才能正确显示呢?

不使用hive的自动扩充精度机制,直接把double减少精度

也就是double —> float,

select id,taxes from table1 where taxes > cast(0.2 as float);

结果:

3 0.3

【hive】关于浮点数比较的问题的更多相关文章

Hive函数大全
一.关系运算: 1. 等值比较: = 语法:A=B 操作类型:所有基本类型描述: 如果表达式A与表达式B相等,则为TRUE:否则为FALSE 举例: hive> select 1 from l ...
Spark入门实战系列--5.Hive（上）--Hive介绍及部署
[注]该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取 .Hive介绍 1.1 Hive介绍月开源的一个数据仓库框架,提供了类似于SQL语法的HQ ...
Hive介绍、安装（转）
1.Hive介绍 1.1 Hive介绍 Hive是一个基于Hadoop的开源数据仓库工具,用于存储和处理海量结构化数据.它是Facebook 2008年8月开源的一个数据仓库框架,提供了类似于SQL语 ...
hive函数参考手册
hive函数参考手册原文见:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF 1.内置运算符1.1关系运算符运 ...
hive[3] 数据类型和文件格式
Hive 支持关系型数据库中的大多数据基本数据类型,同时也支持3种集合类型: 3.1 Hive 的基本数据类型支持多种不同他度的整形和浮点型数据类型,具体如下(全都是保留字): tinyint ...
【转】hive简介安装配置常见问题和例子
原文来自: http://blog.csdn.net/zhumin726/article/details/8027802 1 HIVE概述 Hive是基于Hadoop的一个数据仓库工具,可以将结构化 ...
【转】 hive简介，安装配置常见问题和例子
原文来自: http://blog.csdn.net/zhumin726/article/details/8027802 1 HIVE概述 Hive是基于Hadoop的一个数据仓库工具,可以将结构化 ...
大数据时代的技术hive：hive的数据类型和数据模型
在上篇文章里,我列举了一个简单的hive操作实例,创建了一张表test,并且向这张表加载了数据,这些操作和关系数据库操作类似,我们常把hive和关系数据库进行比较,也正是因为hive很多知识点和关系数 ...
HIVE编程指南之HiveQL的学习笔记1
// HiveQLa) 数据定义语言1 数据库表的一个目录或命名空间,如果用户没有指定数据库的话,那么将会使用默认的数据库default-----创建数据库CREATE DATABASE guoyon ...

随机推荐

转：centos彻底删除文件夹、文件命令
转自:http://www.cnblogs.com/kluan/p/4458296.html centos彻底删除文件夹.文件命令(centos 新建.删除.移动.复制等命令: 1.新建文件夹 mkd ...
Bar Mitzvah Attack分析
结合RC4算法实现,简单分析一下Bar Mitzvah Attack攻击的原理,并以WEP破解过程来举例说明通用的破解方式.(个人觉得RC4早已经过时,要想避免该攻击,应该采用更好的加密算法,如:cc ...
【Python】装饰器 & 偏函数
[装饰器] 1.最简单的Decorator. def author(f): def addName(): print('My name is xkfx.\n') f() return addName ...
CMake入门教程(转帖)
本文转自:https://www.cnblogs.com/never--more/p/6921837.html CMake入门教程参考文献:http://www.ibm.com/developerw ...
20145310《Java程序设计》第3周学习总结
20145310 <Java程序设计>第3周学习总结教材学习内容总结本周学习内容比较多,主要是第四第五章的学习. 第四章类与对象类是对象的设计图,对象是类的实例. 类(Class) ...
go语言中strings包中的Trim函数的作用是什么
答:Trim函数原型如下: func Trim(s string, cutset string) string 去掉字符串s中首部以及尾部与字符串cutset中每个相匹配的字符,如: s=" ...
ubuntu下apt-get的配置文件是哪个
答:在/etc/apt/apt.conf 这个配置文件里可以指定使用代理,如: Acquire::https::proxy "http://myproxy.com:8080/";
实现ModelDriver接口的功能(转）
ModelDriver接口来自com.opensymphony.xwork2.ModelDriven.是xwork-2.1.2-750.jar包的东西. 下面是源码: package com.ope ...
python collections deque
collections是python的高级容器类库,包含了dict.truple之外的常用容器. 下面介绍常用的deque 1. deque是双端队列,可以从两端塞元素进去,也可以从两端取元素. 2. ...
Python基础笔记系列十二：requests模块的简单应用
本系列教程供个人学习笔记使用,如果您要浏览可能需要其它编程语言基础(如C语言),why?因为我写得烂啊,只有我自己看得懂!! httpbin httpbin这个网站能测试 HTTP 请求和响应的各种信 ...

【hive】关于浮点数比较的问题

【hive】关于浮点数比较的问题的更多相关文章

随机推荐

热门专题