2023 Hive 面试大纲
先说一些废话
总结一下Hive面试宝典中的要点,方便读者快速过一遍Hive面试所需要的知识点。
本文请搭配 Hive面试宝典 来食用更美味哟 ┗( ▔, ▔ )┛
方便自己系统性回忆,根据*的数量来标记重要性
*简单了解
**熟悉掌握
***需要精通
- Hive的介绍(*)
- Hive和Hadoop的关系
- Hive的特点
- Hive的缺点
- Hive常见的应用场景
- Hive和mysql的区别
- Hive的架构(*)
- Hive的数据(**)
- Hive的数据模型
- Hive的底层如何存储Null值
- Hive中元数据
metadata和元数据商店metastore)`的作用 - Hive有哪些保存元数据
metadata的方式 - Hive元数据存储方式中,本地模式和远程模式的区别
- Hive的数据类型
- Hive的隐式类型转换规则
- Hive数据存储所使用的文件格式
- Hive中使用的压缩算法
- 什么是数据可分割
- 关于压缩模式说明
- Hive的安装与使用(*)
- 如何在Hive中集成HBase
- 如何通过 HiveSQL 来直接读写 HBase
- Hive的分区和分桶(**)
- 什么是Hive分区
- Hive分区的优点
- Hive分区的缺点
- 什么是Hive分桶
- 关于Hive索引的说明
- Hive分桶的优点
- Hive分桶的缺点
- Hive中静态分区和动态分区的区别
- Hive动态分区的参数设定
- Hive的内部表和外部表(*)
- 什么是Hive的内部表和外部表
- Hive内部表和外部表的区别是什么
- 生产环境中为什么建议使用外部表
- Hive SQL(***)
- Hive中的SQL如何转化成MapReduce任务的
- 什么情况下Hive不走MapReduce任务
- Hive中如何查询A表中B表不存在的数据
- Hive中有哪些连接查询以及如何使用
- Hive中左连接和内连接的区别
- Hive中左连接的底层原理
- Hive查询时候 ON 和 WHERE 有什么区别
- Hive 函数(***)
- 如何使用UDF/UDAF/UDTF
- 为什么使用UDF/UDAF/UDTF
- 你写过什么样的UDF/UDAF/UDT
- Hive自定义函数实现了什么函数什么接口
- Hive中如何去重
- Hive中排序函数的使用方式及区别
- 请说明以下常用函数
split/coalesce/collect list/collect set的功能 - 请描述工作中常用的Hive常用函数及使用场景
- Hive 运维(*)
- 如何监控一个提交后的Hive状态
- Hive 优化(***)
- 请说明你在工作中如何进行Hive优化
- HiveSQL优化 ———— Hive单表查询优化
- HiveSQL优化 ———— Hive多表查询优化
- HiveSQL优化 ———— Hive其他查询优化
- Hive数据倾斜 ———— 单表携带了 Group By 字段的查询
- Hive数据倾斜 ———— 两表或多表的 join 关联时,其中一个表较小,但是 key 集中
- Hive数据倾斜 ———— 两表或多表的 join 关联时,有 Null值 或 无意义值
- Hive数据倾斜 ———— 两表或多表的 join 关联时,数据类型不统一
- Hive数据倾斜 ———— 单独处理倾斜key
- HiveJob优化 ———— HiveMap优化方案
- HiveJob优化 ———— HiveReduce优化方案
- Hive整体优化方案
我是 fx67ll.com,如果您发现本文有什么错误,欢迎在评论区讨论指正,感谢您的阅读!
如果您喜欢这篇文章,欢迎访问我的 本文github仓库地址,为我点一颗Star,Thanks~
转发请注明参考文章地址,非常感谢!!!
2023 Hive 面试大纲的更多相关文章
- BAT美团滴滴java面试大纲(带答案版)之三:多线程Lock
继续面试大纲系列文章. 这是多线程的第二篇. 多线程就像武学中对的吸星大法,理解透了用好了可以得道成仙,俯瞰芸芸众生:而滥用则会遭其反噬. 在多线程编程中要渡的第二个“劫”,则是Lock.在很多时候, ...
- Java面试大纲-java面试该做哪些准备,java开发达到这样的水平可以涨工资
Java培训结束,面临的就是毕业找工作.在找工作时,就要针对性地做充分的面试准备.准备不充分的面试,完全是浪费时间,更是对自己的不负责. 上海尚学堂Java培训整理出Java面试大纲,其中大部分都是面 ...
- BAT美团滴滴java面试大纲(带答案版)之三:多线程synchronized
继续面试大纲系列文章. 从这一篇开始,我们进入ava编程中的一个重要领域---多线程!多线程就像武学中对的吸星大法,理解透了用好了可以得道成仙,俯瞰芸芸众生:而滥用则会遭其反噬. 在多线程编程中要渡的 ...
- 金三银四跳槽季,BAT美团滴滴java面试大纲(带答案版)之一:Java基础篇
Java基础篇: 题记:本系列文章,会尽量模拟面试现场对话情景, 用口语而非书面语 ,采用问答形式来展现.另外每一个问题都附上“延伸”,这部分内容是帮助小伙伴们更深的理解一些底层细节的补充,在面试中可 ...
- BAT美团滴滴java面试大纲(带答案版)之四:多线程Lock
每天学习一点点 编程PDF电子书.视频教程免费下载:http://www.shitanlife.com/code 这是多线程的第二篇. 多线程就像武学中对的吸星大法,理解透了用好了可以得道成仙,俯瞰芸 ...
- Hive面试准备
Hive与HBase的区别Hive架构原理Hive的数据模型及各模块的应用场景Hive支持的文件格式和压缩格式及各自特点Hive内外表的区分方法及内外部差异Hive视图如何创建.特点及应用场景Hive ...
- C/C++程序员面试大纲
基础篇:操作系统.计算机网络.设计模式一:操作系统 1. 进程的有哪几种状态,状态转换图,及导致转换的事件. 2. 进程与线程的区别. 3. 进程通信的几种方式. 4. 线程同步几种方式.(一定要会写 ...
- hive数据仓库入门到实战及面试
第一章.hive入门 一.hive入门手册 1.什么是数据仓库 1.1数据仓库概念 对历史数据变化的统计,从而支撑企业的决策.比如:某个商品最近一个月的销量,预判下个月应该销售多少,从而补充多少货源. ...
- hive最全学习线路和实践练习
非原创,源自:https://www.cnblogs.com/snowbook/p/5723767.html hive被大多数企业使用,学习它,利于自己掌握企业所使用的技术,这里从安装使用到概念.原理 ...
- hive入门学习线路指导
hive被大多数企业使用,学习它,利于自己掌握企业所使用的技术,这里从安装使用到概念.原理及如何使用遇到的问题,来讲解hive,希望对大家有所帮助.此篇内容较多:看完之后需要达到的目标1.hive是什 ...
随机推荐
- 特殊border的样式 -- CSS3实现三种切角效果
效果一: 代码:<div class="cornerCut">corner cutcorner cutcorner cutcorner cut</div> ...
- 为什么序列化要实现Serializable接口
为什么实现了Serializable接口就会序列化? 实现了Java中的Serializable接口的类会被称为可序列化的,这意味着它们的实例可以被序列化为字节流,以便于在网络上传输.保存到文件中或者 ...
- 从 Flink Forward Asia 2021,看Flink未来开启新篇章
简介:本文将对FFA Keynote议题作一些简单的归纳总结,感兴趣的小伙伴们可以在FFA官网[2]找到相关主题视频观看直播回放. 作者 | 梅源(Yuan Mei) 来源 | 阿里技术公众号 ...
- WPF 不安装 WindowsAppSDK 使用 WinRT 功能的方法
安装 Microsoft.WindowsAppSDK 库会限制应用程序只能分发 windows 10 应用,如果自己的应用程序依然需要兼容 Win7 等旧系统,那直接采用安装 WindowsAppSD ...
- WPF 性能测试
本文收藏我给 WPF 做的性能测试.在你开始认为 WPF 的性能存在问题的时候,不妨来这篇博客里找找看我做过的测试.我记录的测试都是比较纯净的测试项目,没有业务逻辑的干扰,写法也正常,可以更加真实反映 ...
- SpringBoot快速配置多数据源(整合MyBatis)
前言 由于业务需求,需要同时在SpringBoot中配置两套数据源(连接两个数据库),要求能做到service层在调用各数据库表的mapper时能够自动切换数据源,也就是mapper自动访问正确的数据 ...
- kubernetes 存储流程
PV 与 PVC PVC (PersistentVolumeClaim),命名空间(namespace)级别的资源,由 用户 or StatefulSet 控制器(根据VolumeClaimTempl ...
- ruby on rails中sidekiq的使用
参考文章: https://www.jianshu.com/p/7ea473097023 安装redis 配置redis 配置sidekiq所依赖的redis位置,必须同时定义sidekiq的serv ...
- tomcat(3)- tomcat部署zrlog
目录 1. Tomcat单独部署 2. nginx+tomcat部署 1. Tomcat单独部署 部署场景为: 客户端:192.168.20.1 tomcat:主机名:tomcat01,地址:192. ...
- 已经调试成功的Protues工程用了一段时间后不能用的问题
已经调试成功的Protues工程,经过一段时间后不能用的问题 主要现象:(1)可以打开,运行时没有效果:(2)可以打开,运行时闪退 解决办法:(1)删除原ARM芯片:(2)重新找到ARM芯片,重新加载 ...