1.hive概述

  Apache Hive数据仓库软件有助于使用SQL读取,编写和管理驻留
在分布式存储中的大型数据集。可以将结构投影到已存储的数据中。
提供了命令行工具和JDBC驱动以将用户连接到Hive。

2.hive优缺点

  优点:
  (1)操作接口采用了sql,简化开发,减少学习成本。
  (2)避免手写mapreduce程序
  (3)hive执行延迟较高,使用场景大多用在实时性要求不强的情景
  (4)优点在于处理大数据
  (5)支持自定义函数
  缺点:
  (1)hive的sql表达能力有限(HSQL)
  (2)hive效率低 hive调优比较难

3.hive架构

  提供了一系列的接口:hive shell、jdbc/odbc、webui

4.hive安装
  (1)下载安装包 官网地址: hive.apache.org
  (2)上传安装包到linux操作系统
    alt+p(此处使用的secureCRT)
  (3)解压
    tar -zxvf .tar -C /opt/moudle/
  (4)修改配置文件
    conf下的 hive-env.sh.temple重命名为hive-env.sh
    修改内容:
    HADOOP_HOME=/opt/moudle/hadoop-2.8.4(修改成自己的hadoop安装目录)
    export HIVE_CONF_DIR=/opt/moudle/hive/conf(修改成自己的hive的conf目录)
  (5)启动hdfs和yarn集群
    start-dfs.sh
    start-yarn.sh
    注意:hive是一种操作数据的软件,它本身不具备存储功能,它的存储依赖的是hdfs,因此启动hive必须启动hadoop。
  (6)在hdfs上创建文件夹
    hdfs dfs -mkdir /tmp
    hdfs dfs -mkdir -p /user/hive/warehouse/
  (7)启动hive(切换到hive的安装目录下再输入以下命令)
    bin/hive

5.hive测试
  1)查看数据库
  show databases;
  2)使用数据库
  use default;
  3)查看表
  show tables;
  4)创建表
  create table student(id int,name string);
  5)插入数据
  insert into  student values(1,"Lilei");
  6)查询
  select * from student;
  7)删除表
  drop table student;
  8)退出终端
  quit;

6.DDL数据定义

  1)创建数据库
    1.1)查看数据库
      show databases;
    1.2)创建数据库
      create database  db_hive;
    1.3)创建数据库标准写法
      create database if not exists db_hive;
    1.4)创建数据库指定所在hdfs路径
      create database hive_db1 location '/hive_db';  

  2)修改数据库

    2.1)查看数据库结构
      desc database hive_db;
    2.2)添加描述信息
      alter database hive_db set dbproperties('dataname'='animal');
    2.3)查看拓展属性
      desc database extended hive_db;

  3)查询数据库
    3.1)显示数据库
      show databases;
    3.2)筛选查询的数据库
      show database like 'db*';
  4)删除数据库
    4.1)删除数据路
      drop database hive_db;
    4.2)删除数据的标准写法
      drop database if exists hive_db;

  5)创建表

    5.1)创建表

      create table student(id int,name string) row format delimited fields terminated by ’\t‘;
  6)管理表

    不擅长做数据共享,删除hive中管理表,数据删除。

    6.1)加载数据
      load data local inpath '/root/itstar.txt' into table student;
    6.2)查询并保存到一张新的表
      create table if not exists student1 as select * from student where name = 'Lilei';
    6.3)查询表结构
      desc formatted emp;

      查询结果:

      Table Type:             MANAGED_TABLE

  7)外部表

    hive不认为这张表拥有这份数据,删除该表,数据不删除。擅长做数据共享。

    7.1)创建外部表
      >create external table if not exists emptable(empno int,ename string)
      > row format
      > delimited fields
      > terminated by '\t';

    7.2)导入数据
      load data local inpath '/root/emp.txt' into table emptable;
    7.3)查看表的结构
      desc formatted emptable;

     查询结果:

      Table Type: EXTERNAL_TABLE
    7.4)删除表
      drop table emptable;

    提示:再次创建相同的表 字段相同 将自动关联数据!

    如果对你有帮助,欢迎转载!

    

hive介绍、安装配置、表操作基础知识适合小白学习的更多相关文章

  1. 《JAVASCRIPT高级程序设计》表单基础知识和文本框脚本

    在HTML中,表单是由<form>元素来表示,在javascript中,表单对应的是HTMLFormElement类型,它具有一些独有的属性和方法: 一.表单基础知识 1.取得表单的方式 ...

  2. 【ABAP系列】SAP ABAP-模块 字符串操作基础知识

    公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[ABAP系列]SAP ABAP-模块 字符串操 ...

  3. [SQL]SQL Server数据表的基础知识与增查删改

    SQL Server数据表的基础知识与增查删改 由张晨辉(学生) 于19天 前发表 | 阅读94次 一.常用数据类型 .整型:bigint.int.smallint.tinyint .小数:decim ...

  4. Hive的安装配置

    Hive的安装配置 Hive的安装配置 安装前准备 下载Hive版本1.2.1: 1.[root@iZ28gvqe4biZ ~]# wget http://mirror.bit.edu.cn/apac ...

  5. 【转】hive简介安装 配置常见问题和例子

    原文来自:  http://blog.csdn.net/zhumin726/article/details/8027802 1 HIVE概述 Hive是基于Hadoop的一个数据仓库工具,可以将结构化 ...

  6. Hive 组件安装配置

    下载和解压安装文件 基础环境和安装准备 Hive组件的部署规划和软件包路径如下: (1)当前环境中已安装 Hadoop全分布系统 (2)本地安装 MySQL数据库(账号 root,密码 Passwor ...

  7. IDEA 安装配置及操作总结(新手必看)

    Jetbrains官网下载IDEA15 我们在浏览器输入网址https://www.jetbrains.com/.选择相应的系统版本,下载最新版本的IDEA15,Windows系统双击安装文件,根据界 ...

  8. SharePoint Framework (SPFx)安装配置以及开发-基础篇

    前言 SharePoint Framework(SPFx),是页面 和Webpart的模型,完全支持本地开发(即完全可以脱离SharPoint环境在本地进行开发),SPFx包含了一系列的client- ...

  9. [Hive_2] Hive 的安装&配置

    0. 说明 在安装好 Hadoop 集群和 ZooKeeper 分布式的基础上装好 MySQL,再进行 Hive 安装配置 1. 安装 1.1 将 Hive 安装包通过 Xftp 发送到 /home/ ...

随机推荐

  1. redis 命令select、dbsize、清空数据库、info、client

    select 切换库 dbsize 当前库中数据条数 清空数据库 flushdb | flushall 清空数据,一个是清空当前库,一个清空当前实例 查看服务器及redis相关信息 infoinfo ...

  2. Asp.net mvc Kendo UI Grid的使用(三)

    上一篇的操作已经能够显示基本数据了,这次介绍一下如何进行数据操作以及显现自定义命令. 第一步当然还是准备数据: [HttpPost] public ActionResult PersonalList_ ...

  3. 10.Spring——框架的AOP

    1.Spring 框架的 AOP 2.Spring 中基于 AOP 的 XML架构 3.Spring 中基于 AOP 的 @AspectJ 1.Spring 框架的 AOP Spring 框架的一个关 ...

  4. 使用 PowerShell 创建和修改 ExpressRoute 线路

    开始之前 安装最新版本的 Azure Resource Manager PowerShell cmdlet. 有关详细信息,请参阅 Azure PowerShell 概述. 在开始配置之前,请查看先决 ...

  5. plsql常用函数

    1)处理字符的函数 || 或 CONCAT---并置运算符. 格式∶CONCAT(STRING1, STRING2) 例:’ABC’|| ’DE’=’ABCDE’ CONCAT(‘ABC’,’DE’) ...

  6. Python爬虫实战---抓取图书馆借阅信息

    Python爬虫实战---抓取图书馆借阅信息 原创作品,引用请表明出处:Python爬虫实战---抓取图书馆借阅信息 前段时间在图书馆借了很多书,借得多了就容易忘记每本书的应还日期,老是担心自己会违约 ...

  7. Entity Framework对同一张表配置一对多关系

    在实际的项目开发中,可能会遇到同一张表同时保存自身和上级(或下级)的信息(一般是通过设置一个上级主键[ParentId]的列与主键[Id]关系) 例如:城市库,有国家.省.市...,省的ParentI ...

  8. 排序算法(2) 堆排序 C++实现

    堆 1 数组对象 2 可以视为一棵完全二叉树 3 一个堆可以被看作一棵二叉树和一个数组,如下图所示: 4 下标计算(通常使用内联函数或者宏来定义下标操作): 已知某个结点的下标为i 其父节点下标:i/ ...

  9. 铁乐学Python_day09_函数

    今天我们来学习函数. 产生的原由,若没有函数,会显得重复代码多,可读性差,也会造成重复造轮子的情景. 故产生了函数,用来封装好一个功能,它是以功能为导向的. 1.[函数的样式] 例如自己定义一个函数: ...

  10. Tomcat 配置学习

    1 server.xml <host appBase="d:/aaa"> <Context path="/smswap" reloadable ...