概述 基于Spark,兼容Hive 集成在Spark中,不需单独安装 提供统一的数据访问方式 结构化的数据类型:JDBC.JSON.Hive.Parquet(Saprk SQL 默认数据源) 支持标准的数据连接:JDBC.ODBC Hive把sql解析成了mapreduce程序,sparksql把sql语句解析成了Spark任务 spark core 操作RDD,spark sql 操作DataFrame RDD内部元素是java对象,DataFrame内部是Row对象,相比于RDD多了元信息…