一.认识Spark sql 1.什么是Sparksql? spark sql是spark的一个模块,主要用于进行结构化数据的处理,它提供的最核心抽象就是DataFrame. 2.SparkSQL的作用? 提供一个编程抽象(DataFrame),并且作为分布式SQL查询引擎 DataFrame:它可以根据很多源进行构建,包括:结构化的数据文件.hive中的表,外部的关系型数据库.以及RDD 3.运行原理 将SparkSQL转化为RDD,然后提交到集群执行 4.特点 容易整合.统一的数据访问方式.兼