一.Hive概述 1.Hive简介 Hive数据仓库软件有助于使用SQL读取.编写和管理驻留在分布式存储中的大型数据集.提供了命令行工具和JDBC驱动程序以将用户连接到Hive. Hive可以将SQL语句自动转化为Mapreduce程序,节省了手写框架的困难. 2.Hive优缺点 优点:1)操作接口采用了SQL,避免了首先MR程序,简化开发,降低学习成本: 2)Hive依赖于HDFS做存储,是HDFS上的工具: 3)Hive虽然使用SQL,但是他能处理大规模的数据: 4)Hive支持自定义函数.…