phoenix作为查询引擎,为了提高查询效率,为phoenix表创建了二级索引,而数据是sparkstreaming通过hbase api直接向hbase插数据.那么问题来了,对于phoenix的二级索引,直接插入底层hbase的源表,不会引起二级索引的更新,从而导致phoenix索引数据和hbase源表数据不一致.而对于spark+phoenix的写入方式,官方有文档说明,但是有版本限制,以下是官方原文: To ensure that all requisite Phoenix / HBase…