1)对于hive内置的列,不是自己建的,在查询的时候需要添加反引号` 比如:`_mt_message`,别在这里犯错误,

(2)南京的_mt_message是json的格式,所以可以直接使用:get_json_object(`_mt_message`,'$.Flag')

南京的:

代码块
 
 
 
 
 
 
{"EngineId":"90927395","GPSBrand":"伴车星","OwnerName":"南京壹健汽车租赁有限公司","FeePrintId":"757012490408","VehicleNo":"苏A88H7J","Address":320100,"GPSModel":"ET02D","TransDateStart":20170703,"CheckState":"1","GPSInstallDate":20151113,"TransAgency":"南京市道路运输管理局","FuelType":"A","CertifyDateB":20170703,"FixState":"1","CertifyDateA":20181228,"CompanyId":"33030009","FareType":"222-c-1-1","VehicleType":"小型汽车","RegisterDate":20180911,"TransArea":"南京","Flag":2,"Seats":5,"Brand":"荣威","PhotoId":"https://p0.meituan.net/dache/238553418911c6fb51cfa160211199222613832.jpg@1500h?token=1.1545927117.dache.a605eb5b9dfbf5c0ccaf6ea2ba4a8a01","CommercialType":1,"driverId":195139349,"VehicleColor":"白色","State":0,"Model":"i6","UpdateTime":20181228000337,"PlateColor":"1","VIN":"50D65D3FF6C241192","EngineDisplace":"1600","TransDateStop":20210701}
 

但是上海的不是:

代码块
 
 
 
 
 
 
3 shanghai{"EngineId":"90927395","GPSBrand":"伴车星","OwnerName":"南京壹健汽车租赁有限公司","FeePrintId":"757012490408","VehicleNo":"苏A88H7J","Address":320100,"GPSModel":"ET02D","TransDateStart":20170703,"CheckState":"1","GPSInstallDate":20151113,"TransAgency":"南京市道路运输管理局","FuelType":"A","CertifyDateB":20170703,"FixState":"1","CertifyDateA":20181228,"CompanyId":"33030009","FareType":"222-c-1-1","VehicleType":"小型汽车","RegisterDate":20180911,"TransArea":"南京","Flag":2,"Seats":5,"Brand":"荣威","PhotoId":"https://p0.meituan.net/dache/238553418911c6fb51cfa160211199222613832.jpg@1500h?token=1.1545927117.dache.a605eb5b9dfbf5c0ccaf6ea2ba4a8a01","CommercialType":1,"driverId":195139349,"VehicleColor":"白色","State":0,"Model":"i6","UpdateTime":20181228000337,"PlateColor":"1","VIN":"50D65D3FF6C241192","EngineDisplace":"1600","TransDateStop":20210701}
 

所以上海的在查询的话应该先截取,然后在get_json_object();

如下:

代码块
 
 
 
 
 
 
 select get_json_object(substr(`_mt_message`,11),'$.PhotoId') from log.qcs_regulation_shanghai where dt='20181228' and msgtype='baseInfoVehicle'   
 
 
 
 
 
 
 
select * from log.qcs_regulation_shanghai where dt='20181120' limit 10;
 

查询南京订单成功上传数据总量

hive 查询注意问题的更多相关文章

  1. 使用shell+awk完成Hive查询结果格式化输出

    好久不写,一方面是工作原因,有些东西没发直接发,另外的也是习惯给丢了,内因所致.今天是个好日子,走起! btw,实际上这种格式化输出应该不只限于某一种需求,差不多是通用的. 需求: --基本的:当前H ...

  2. hive查询遇到java.io.EOFException: Unexpected end of input stream错误

    hive查询遇到java.io.EOFException: Unexpected end of input stream错误 原因基本上有两个: 空文件 不完整的文件 解决办法: 删除对应文件- 参考 ...

  3. hive查询ncdc天气数据

    使用hive查询ncdc天气数据 在hive中将ncdc天气数据导入,然后执行查询shell,可以让hive自动生成mapredjob,快速去的想要的数据结果. 1. 在hive中创建ncdc表,这个 ...

  4. hive查询不加分区的一个异常

    今天下午有同事反馈她提交了了一个SQL后,hive 查询就停止响应了. 我看了下,发现hiveserver确实hug住了.听过查看日志,发现了一个牛逼的SQL, 这个SQL很简单: select a. ...

  5. hive查询语句入门(hive DDL)

    hive DDL 启动hadoop /apps/hadoop/sbin/start-all.sh 开启MySQL库,用于存放hive的元数据 sudo service mysql start 启动hi ...

  6. 求解:为什么impala实现hive查询 可以使用ifnull()函数,不可以使用length() 函数

    求大神解惑,找了很久都没有找到为什么??? hive支持length() 函数,不支持ifnull()函数??? impala实现hive查询 支持ifnull()函数,不支持length()  函数 ...

  7. cdh5.7 做完HA后hive 查询出现异常: expected: hdfs://nameservice

    异常信息如下: select * from b_pt_pr_customer_address_info limit 19; FAILED: SemanticException Unable to de ...

  8. hive查询语句

    一. 为什么hive是数据仓库 hive局限于hdfs, 不能进行记录级别的增删改 hive底层的mapreduce启动耗时很长, 无法做到传统数据库的秒查, 只适合离线分析 hive不支持事务, 无 ...

  9. Hive查询结果批量插入分区

    在hive的数据建表时,为了查询的高效性,我们经常会对表建立分区,例如下面的表 create external table dm_fan_photo_icf_basic(user string, it ...

随机推荐

  1. pandas 选择列或者添加列生成新的DataFrame

    选择某些列 import pandas as pd # 从Excel中读取数据,生成DataFrame数据 # 导入Excel路径和sheet name df = pd.read_excel(exce ...

  2. 2018年尚硅谷《全套Java、Android、HTML5前端视频》

    全套整合一个盘里:链接:https://pan.baidu.com/s/1nwnrWOp 密码:h4bw 如果分类里没有请下载下边那些小项教程链接 感谢尚硅谷提供的视频教程:http://www.at ...

  3. Python学习笔记(1)-列表

    列表是什么? 列表由一系列按特定顺序排列的元素组成.列表看起来像这样:[1,2,3,4,1].在列表中,可以由零个或多个元素组成,元素之间用逗号分开,具有相同值元素允许出现多次 使用[ ]或list( ...

  4. ubuntu 在 Windows 下的安装

    1. ubuntu 下载官网:https://www.ubuntu.com/index_kylin

  5. .net core 简单项目的创建

    1.linux 安装net coref https://www.microsoft.com/net/learn/get-started/linuxubuntu 2.创建目录 2.创建控制台项目 第一次 ...

  6. C#总结(一)AutoResetEvent的使用介绍(用AutoResetEvent实现同步)

    前几天碰到一个线程的顺序执行的问题,就是一个异步线程往A接口发送一个数据请求.另外一个异步线程往B接口发送一个数据请求,当A和B都执行成功了,再往C接口发送一个请求.说真的,一直做BS项目,对线程了解 ...

  7. Spark SQL在100TB上的自适应执行实践(转载)

    Spark SQL是Apache Spark最广泛使用的一个组件,它提供了非常友好的接口来分布式处理结构化数据,在很多应用领域都有成功的生产实践,但是在超大规模集群和数据集上,Spark SQL仍然遇 ...

  8. 警告:Establishing SSL connection without server's identity verification is not recommended

    SpringBoot启东时红色警告: Mon Jun 04 00:53:48 CST 2018 WARN: Establishing SSL connection without server's i ...

  9. Python中IO概述

    Python中的io模块是用来处理各种类型的I/O操作流.主要有三种类型的I/O类型:文本I/O(Text I/O),二进制I/O(Binary I/O)和原始I/O(Raw I/O).它们都是通用类 ...

  10. urllib库

    python内置的最基本的HTTP请求库,有以下四个模块: urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url解析模块 urllib.ro ...