一.表设计 合理分表 合理设计表分区,静态分区.动态分区 二.扫描相关 1.谓词下推(Predicate Push Down) 2.列裁剪(Column Pruning) 在读数据的时候,只关心感兴趣的列,而忽略其他列 对于查询:select a,b from src where e < 10 其中,src包含5个列(a.b.c.d.e),列c.d将会被忽略,只会读取a,b,e列 选项默认为真,hive.optimize.cp=true 3.分区剪裁(Partition Pruning) 在查询…