Hive 入门学习线路指导
hive被大多数企业使用,学习它,利于自己掌握企业所使用的技术,这里从安装使用到概念、原理及如何使用遇到的问题,来讲解hive,希望对大家有所帮助。
此篇内容较多:
看完之后需要达到的目标:
- 1.hive是什么
- 2.明白hive的原理
- 3.会使用hive
- 4.会使用hive编程
1.hive
首先我们需要hive是什么?让你真正明白什么是hive
上面讲的很明白
1.hive是一个数据仓库
2.hive基于hadoop。
总结为一句话:hive是基于hadoop的数据仓库。
hive明白之后,如同我们明白了关系数据库是什么了,那么我们该如何使用操作它:
首先我们要安装,安装分为很多种分为单机遇集群安装。
可参考下面内容:(正在更新)
上面需要说明的是hive默认元数据库并不是mysql,但是因为默认元数据库存在局限,所以最好使用mysql。下面我们附一张图,先从整体了解。
安装完毕,那么我们就需要练练手了,可以根据下面内容
hive基本操作:
会了基本的操作还不够,如同我们需要了解sql语法一样,我们需要了解hive各种语法
- Hadoop Hive sql语法详解1-认识hive及DDL操作
- Hadoop Hive sql语法详解2-修改表结构
- Hadoop Hive sql语法详解3--DML 操作:元数据存储
- Hadoop Hive sql语法详解4--DQL 操作:数据查询SQL
- Hadoop Hive sql语法详解5--HiveQL与SQL区别
这里面包含了加载数据、查询数据等各种操作。
上面是一些基本的操作,下面还有一些负责一些操作如:
- Hive快捷查询:不启用Mapreduce job启用Fetch task三种方式介绍
- Hive如何执行文件中的sql语句
- Hive四种数据导入方式介绍
- Hive中的三种不同的数据导出方式介绍
- Hive如何创建索引
上面基本属于实战类型,我们还需要高级进阶,我们需要了解里面的原理,我们需要知道遇到问题,该如何解决。
原理:
- 全面了解hive
- Hive体系结构介绍
- hive实现原理
- hive内部表与外部表区别详细介绍
- HIVE中Join的专题---Join详解
- 让你彻底明白hive数据存储各种模式
- Hive配置文件中配置项的含义详解(收藏版)
- HIVE与传统数据库对比
- hive详解
- hive 配置参数说明(收藏版)
- hive支持sql大全(收藏版)
- hive 创建/删除/截断 表
原理大致懂了,基本操作会了,我们可能又有了更进一步的认识,那么hive如何结合hadoop,hbase发挥作用,该如何发挥它的实际意义,被我们所用。
首先我们使用hive的时候,很多都与hbase相结合,这样发挥hive的长处,在各种查询数据方面相比hbase使用更方便。
上面是与hbase结合使用,那么我们该如何与编程语言向结合,可以参考下面内容:
上面或许你已经对hive有所了解,下面的面试及遇到的问题,大家可参考
- hive找不到创建的表了
- Shark对Hive的支持与不支持的语法介绍
- 面试题:分别使用Hadoop MapReduce、hive统计手机流量
- hive面试题目:表大概有2T左右,对表数据转换
- hive如何通过设置日志定位错误
- hive在腾讯分布式数据库时间分享
参考资料:
Hive 入门学习线路指导的更多相关文章
- hive入门学习线路指导
hive被大多数企业使用,学习它,利于自己掌握企业所使用的技术,这里从安装使用到概念.原理及如何使用遇到的问题,来讲解hive,希望对大家有所帮助.此篇内容较多:看完之后需要达到的目标1.hive是什 ...
- Cloudera Manager、CDH零基础入门、线路指导 http://www.aboutyun.com/thread-9219-1-1.html (出处: about云开发)
Cloudera Manager.CDH零基础入门.线路指导http://www.aboutyun.com/thread-9219-1-1.html(出处: about云开发) 问题导读:1.什么是c ...
- Hive入门学习随笔(一)
Hive入门学习随笔(一) ===什么是Hive? 它可以来保存我们的数据,Hive的数据仓库与传统意义上的数据仓库还有区别. Hive跟传统方式是不一样的,Hive是建立在Hadoop HDFS基础 ...
- Hive入门学习--HIve简介
现在想要应聘大数据分析或者数据挖掘岗位,很多都需要会使用Hive,Mapreduce,Hadoop等这些大数据分析技术.为了充实自己就先从简单的Hive开始吧.接下来的几篇文章是记录我如何入门学习Hi ...
- Hadoop新手学习线路指导
对于我们新手入门学习hadoop大数据存储的朋友来说,首先了解一下云计算和云计算技术是有必要的.下面先是介绍云计算和云计算技术的: 云计算,是一种基于互联网的计算方式,通过这 ...
- openstack学习线路指导
原文链接: http://www.aboutyun.com/thread-7225-1-1.html 网上很多hadoop资料,openstack资料相对较少,这里整理一下,帮助初学者尽快入门. 首先 ...
- Hive入门学习
Hive学习之路 (一)Hive初识 目录 Hive 简介 什么是Hive 为什么使用 Hive Hive 特点 Hive 和 RDBMS 的对比 Hive的架构 1.用户接口: shell/CLI, ...
- Hive入门学习随笔(二)
====使用Load语句执行数据的导入 --将操作系统上的文件student01.txt数据导入到t2表中 load data local inpath '/root/data/student01.t ...
- 零基础学习hadoop到上手工作线路指导(编程篇)
问题导读: 1.hadoop编程需要哪些基础? 2.hadoop编程需要注意哪些问题? 3.如何创建mapreduce程序及其包含几部分? 4.如何远程连接eclipse,可能会遇到什么问题? 5.如 ...
随机推荐
- Unity3D笔记 模型和角色动画的输出设置
- lombok 转载
http://www.blogjava.net/fancydeepin/archive/2012/07/12/lombok.html LomBok主要特性有:自动生成默认的getter/setter方 ...
- html css的内联样式 内部样式表 外部样式表的优先级
http://www.w3school.com.cn/html/html_css.asp 这三种样式是有优先级的,记住他们的优先级:内联式 > 嵌入式 > 外部式,但是嵌入式>外部式 ...
- ABP之应用服务(1)
在一个理想的层级项目中,展现层是不能直接访问领域对象的,那么展现层如何获取到自己需要的数据呢?也就是今天的主角-Application层,它的职责就是为展现层服务,它通过仓储获取到相应的数据,然后将数 ...
- java 中方法的重写
方法的重写 1.在子类中可以根据需要对从基类中继承来的方法进行重写. 2.方法重写必须要和被重写方法具有相同方法名称.参数列表和返回类型. 3.重写方法不能使用比被重写方法更严格的访问权限 4.注意与 ...
- Java基础类编程集锦
1.计算1+2+3+4+5+6+7+8+9的值 package com.neusoft.chapter1; /** * @author zhao-chj *题:计算1+2+3+4+5+6+7+8+9的 ...
- UOJ 145 - 神奇的幻方 - [简单数学题]
题目链接:http://uoj.ac/problem/145 题目描述 幻方是一种很神奇的 N∗N 矩阵:它由数字 1,2,3,⋯⋯,N×N 构成,且每行.每列及两条对角线上的数字之和都相同. 当 N ...
- Gym - 101628F Find the Inn dijkstra,读边时计算新权值
题意: 给n个点m条边及每条边所花费的时间,经过给定的p个点时会停留k秒,要求在t秒内从1号点走到n号点,若可以走到输出最短时间,若不行输出-1.. 题解:读取边时,将每个点停留的时间加到以其为终点的 ...
- python string 模块
标准库 python3 python2.7 都可以用 sting.ascii_letters是生成所有字母,从a-z和A-Z, string.digits是生成所有数字0-9. import stri ...
- 模仿linux内核定时器代码,用python语言实现定时器
大学无聊的时候看过linux内核的定时器,如今已经想不起来了,也不知道当时有没有看懂,如今想要模仿linux内核的定时器.用python写一个定时器,已经想不起来它的设计原理了.找了一篇blog,li ...