基于PostgreSQL,总结几条常用的查询操作的优化建议,部分也适用于Oracle等数据库. 1.选择合适的分布键 分布键选择不当会导致重分布.数据分布不均等,而数据分布不均会使SQL集中在一个segment节点的执行,限制了gp整体的速度.查看某表是否分布不均: select gp_segment_id,count(*) from table_name group by gp_segment_id ; 例子如图: 2.使用分区表 按照某字段进行分区,不影响数据在数据节点上的分布,但是,仅在单…
1.建立自己的知识体系 摘抄一句话你所拥有的知识并不取决于你记得多少,而在于它们能否在恰当的时候被回忆起来: 做笔记: 把笔记放在可以随时被找到的地方.个人的笔记可以放在印象笔记之类工具上,单位上的笔记,本地保存一份后,建议同步到码云 少数核心的内容要被熟练记忆,数据仓库常见表,常见表的常见字段,常见表的关联条件: 2.知己知彼 2.1.使用前查看数据,做数据探索 use db go --查看一下内容: select top 10 * from XXXXX select * from XXXXX…
1.对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null 最好不要给数据库留NULL,尽可能的使用 NOT NULL填充数据库. 备注.描述.评论之类的可以设置为 NULL,其他的,最好不要使用NULL. 不要以为 NULL 不需要空间,比如:char(100) …