Hadoop 面试题之Hive

1.Hive 有哪些方式保存元数据，各有哪些特点。

15. Hive内部表和外部表的区别

23.hive底层与数据库交互原理
Hive的Hql语句掌握情况?

36.使用Hive或自定义mr实现如下逻辑：

product_no lac_id moment start_time user_id county_id staytime city_id 13429100031 22554 8 2013-03-11 08:55:19.151754088 571 571 282 571 13429100082 22540 8 2013-03-11 08:58:20.152622488 571 571 270 571 13429100082 22691 8 2013-03-11 08:56:37.149593624 571 571 103 571 13429100087 22705 8 2013-03-11 08:56:51.139539816 571 571 220 571 13429100087 22540 8 2013-03-11 08:55:45.150276800 571 571 66 571 13429100082 22540 8 2013-03-11 08:55:38.140225200 571 571 133 571 13429100140 26642 9 2013-03-11 09:02:19.151754088 571 571 18 571 13429100082 22691 8 2013-03-11 08:57:32.151754088 571 571 287 571 13429100189 22558 8 2013-03-11 08:56:24.139539816 571 571 48 571 13429100349 22503 8 2013-03-11 08:54:30.152622440 571 571 211 571 字段解释： product_no：用户手机号； lac_id：用户所在基站； start_time：用户在此基站的开始时间； staytime：用户在此基站的逗留时间。需求描述：根据 lac_id 和 start_time 知道用户当时的位置，根据 staytime 知道用户各个基站的逗留时长。根据轨迹合并连续基站的 staytime。最终得到每一个用户按时间排序在每一个基站驻留时长期望输出举例： 13429100082 22540 8 2013-03-11 08:58:20.152622488 571 571 270 571 13429100082 22691 8 2013-03-11 08:56:37.149593624 571 571 390 571 13429100082 22540 8 2013-03-11 08:55:38.140225200 571 571 133 571 13429100087 22705 8 2013-03-11 08:56:51.139539816 571 571 220 571 13429100087 22540 8 2013-03-11 08:55:45.150276800 571 571 66 571 Linux 脚本能力考察：
59.pig latin,hive 语法有什么不同
71.hive如何调优

72.hive 如何权限控制？

74.hive能像关系数据库那样，建多个库吗？

110. hive 实现统计的查询语句是什么?

115.对比hive与mapreduce统计手机流量的区别？

HIve也问了一些，外部表，还有就是hive的物理模型跟传统数据库的不同

134.Hive元数据保存的方法有哪些，各有什么特点？

145.对于hive，你写过哪些udf函数，作用是什么？

148.hive 底层与数据库交互原理。

362.你们写hive的hql语句，大概有多少条？
364.hive 跟hbase的区别是？
379.hive 中的压缩格式RCfile .TextFile SequenceFile 各有什么区别？

以上3种格式一样大的文件哪个占用空间大小，还有hadoop中的一个HA压缩。
395.你们hive处理数据能到到的指标是多少？

408.Hive 的工作原理、两种元数据存放方式、几种表之间的区别、数据导入的几种方式、几种文件格式、UDF函数、性能调优(重点是join 的时候如何放置大小表)？

412.hive的两张表关联，使用mapreduce 是怎么写的？

提示：打标记笛卡尔乘积

413.hive 相对于oracle来说有哪些优点？

提示：hive 是数据仓库，oracle是数据库，hive 能够存储海量数据，hive还有更重要的作用就是数据分析，最主要的是免费。

472.hive优化

475.hive的sort by 和 order by 的区别

http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2843243.html

476.Hive里面用什么代替in 查询

提示：Hive中的left semi join 替换sql 中的in 操作

488.hive如何优化
549.你们用hive-15啊

Hadoop 面试题之Hive的更多相关文章

Hadoop 面试题redis
Hadoop 面试题之十 548.redis有什么特别之处,为什么用redis,用hbase 不行么? 答:redis 是基于内存的数据库,速度快 551.redis用什么版本? 3.0以上才支持集群 ...
Hadoop 面试题之Hbase
Hadoop 面试题之九 16.Hbase 的rowkey 怎么创建比较好?列族怎么创建比较好? 答: 19.Hbase 内部是什么机制? 答: 73.hbase 写数据的原理是什么? 答: 75.h ...
Hadoop 面试题之storm 3个
Hadoop 面试题之八 355.metaq 消息队列 zookeeper 集群 storm集群(包括 zeromq,jzmq,和 storm 本身)就可以完成对商城推荐系统功能吗?还有其他的中间件? ...
hadoop面试题答案
Hadoop 面试题,看看书找答案,看看你能答对多少(2) 1. 下面哪个程序负责 HDFS 数据存储.a)NameNode b)Jobtracker c)Datanode d)secondary ...
大数据hadoop面试题2018年最新版（美团）
还在用着以前的大数据Hadoop面试题去美团面试吗?互联网发展迅速的今天,如果不及时更新自己的技术库那如何才能在众多的竞争者中脱颖而出呢? 奉行着"吃喝玩乐全都有"和"美 ...
基于hadoop分析，了解hive的使用
一.Hadoop理论 Hadoop是一个专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式. Hadoop=HDFS(文件系统,数据存储技术相关)+ Mapreduce ...
Hadoop生态圈-Azkaban实现hive脚本执行
Hadoop生态圈-Azkaban实现hive脚本执行作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客中在HDFS分布式系统取的数据,而这个数据的是有之前我通过MapRed ...
ubuntu18.04 安装hadoop 2.7.3+hive 2.3.4
1. 安装hadoop 详细请参见本人的另外一片博文<Hadoop 2.7.3 分布式集群安装> 2. 下载hive 2.3.4 解压文件到/opt/software -bin.tar.g ...
HADOOP docker(四):安装hive
1.hive简介2.安装hive2.1 环境准备2.1.1 下载安装包2.1.2 设置hive用户的环境变量2.1.3 hive服务端配置文件2.1.4 hive客户端配置文件2.1.4 分发hive ...

随机推荐

CSS3系列四（Media Queries移动设备样式）
viewport设置适应移动设备屏幕大小 viewport:允许开发者创建一个虚拟窗口并自定义其窗口的大小或缩放功能 <meta name="viewport" conten ...
JZOJ P1847：找01串
传送门 DP预处理+贪心首先设$f[i][j]$表示长度为$i$的01串中有不大于$j$个1,然后显然 $f[i][j]=\sum_{k=1} ^{j} C[i][k]$ $C[i][j]=C[i- ...
BZOJ4653: [Noi2016]区间
传送门 UOJ上卡掉一个点,COGS上卡掉两个点..弃疗,不改了,反正BZOJ上过啦hhh 先把区间按长度递增排序.然后每次用线段树维护区间最大覆盖次数,用一个指针随便扫扫就行了. //NOI 201 ...
ecshop 远程图片本地化
define('IN_ECS', true); require(dirname(__FILE__) . '/includes/init.php'); $smarty->assign('siteD ...
用GDB调试程序（一）
http://blog.csdn.net/haoel/article/details/2879 用GDB调试程序 GDB概述———— GDB是GNU开源组织发布的一个强大的UNIX下的程序调试工具.或 ...
winform的tab跳到下一个
先设置TabStop=true,再设置TabIndex的顺序
easyUI 树的上下文菜单
一.属性:onContextMenu onContextMenu: function(e,node){ e.preventDefault(); $(this).tree('select',node.t ...
JavaWeb学习笔记——XML解析
DOM解析操作只在跟节点<addresslist>下面建立一个子节点<name> <?xml version="1.0" encoding=&quo ...
win10系统点击关机按钮后无法关机的解决办法
先吐槽下:我越发的发现我现在成了修电脑的了,我的职位是linux运维,现在干的活很蛋疼,公司只有我一个运维,修电脑.搞网络.抬服务器.弄监控,搭环境.搞自动化发布.弄虚拟化都我一个人哇.好了,打住. ...
gitingore
**/.DS_Store node_modules/ logs/*.log views/dir/*.tpl(视图文件后缀)

Hadoop 面试题 之Hive

Hadoop 面试题 之Hive的更多相关文章

随机推荐

热门专题

Hadoop 面试题之Hive

Hadoop 面试题之Hive的更多相关文章