1.针对PostgreSQL数据库表的去重复方法基本有三种,这是在网上查找的方法,在附录1给出.但是这些方法对GreenPlum来说都不管用. 2.数据表分布在不同的节点上,每个节点的ctid是唯一的,但是不同的节点就有ctid重复的可能,因此GreenPlum必须借助gp_segment_id来进行去重复处理. 3.在网上找到了一个相对繁琐的方法,在附录2给出: 4.最终的方法是: delete from test where (gp_segment_id, ctid) not in (sel…