一.API 1. 出现新的上下文接口:SparkSession,统一了SQLContext和HiveContext,并且为SparkSession开发了新的流式调用的configuration API 2. 统一了DataFrame和DataSet.DataFrame相当于DataSet[Row],以及DataSet的增强聚合API 3. 增强了累加器accumulator的功能,支持Web UI,便捷的API,性能更高 二.SQL 1. 支持SQL2003标准 2. 支持ansi-sql 和h…