曲线点抽稀算法-Python实现

何为抽稀

在处理矢量化数据时，记录中往往会有很多重复数据，对进一步数据处理带来诸多不便。多余的数据一方面浪费了较多的存储空间，另一方面造成所要表达的图形不光滑或不符合标准。因此要通过某种规则，在保证矢量曲线形状不变的情况下，最大限度地减少数据点个数，这个过程称为抽稀。

通俗的讲就是对曲线进行采样简化，即在曲线上取有限个点，将其变为折线，并且能够在一定程度保持原有形状。比较常用的两种抽稀算法是：道格拉斯-普克(Douglas-Peuker)算法和垂距限值法。

道格拉斯-普克(Douglas-Peuker)算法

Douglas-Peuker算法(DP算法)过程如下:

1、连接曲线首尾两点A、B；
2、依次计算曲线上所有点到A、B两点所在曲线的距离；
3、计算最大距离D，如果D小于阈值threshold,则去掉曲线上出A、B外的所有点；如果D大于阈值threshold,则把曲线以最大距离分割成两段；
4、对所有曲线分段重复1-3步骤，知道所有D均小于阈值。即完成抽稀。

这种算法的抽稀精度与阈值有很大关系，阈值越大，简化程度越大，点减少的越多；反之简化程度越低，点保留的越多，形状也越趋于原曲线。

下面是Python代码实现:

# -*- coding: utf-8 -*-

"""

-------------------------------------------------

  File Name：    DouglasPeuker

  Description :  道格拉斯-普克抽稀算法

  Author :        J_hao

  date：          2017/8/16

-------------------------------------------------

  Change Activity:

                  2017/8/16: 道格拉斯-普克抽稀算法

-------------------------------------------------

"""

from __future__ import division

from math import sqrt, pow

__author__ = 'J_hao'

THRESHOLD = 0.0001  # 阈值

def point2LineDistance(point_a, point_b, point_c):

    """

    计算点a到点b c所在直线的距离

    :param point_a:

    :param point_b:

    :param point_c:

    :return:

    """

    # 首先计算b c 所在直线的斜率和截距

    if point_b[0] == point_c[0]:

        return 9999999

    slope = (point_b[1] - point_c[1]) / (point_b[0] - point_c[0])

    intercept = point_b[1] - slope * point_b[0]

    # 计算点a到b c所在直线的距离

    distance = abs(slope * point_a[0] - point_a[1] + intercept) / sqrt(1 + pow(slope, 2))

    return distance

class DouglasPeuker(object):

    def __init__(self):

        self.threshold = THRESHOLD

        self.qualify_list = list()

        self.disqualify_list = list()

    def diluting(self, point_list):

        """

        抽稀

        :param point_list:二维点列表

        :return:

        """

        if len(point_list) < 3:

            self.qualify_list.extend(point_list[::-1])

        else:

            # 找到与收尾两点连线距离最大的点

            max_distance_index, max_distance = 0, 0

            for index, point in enumerate(point_list):

                if index in [0, len(point_list) - 1]:

                    continue

                distance = point2LineDistance(point, point_list[0], point_list[-1])

                if distance > max_distance:

                    max_distance_index = index

                    max_distance = distance

            # 若最大距离小于阈值，则去掉所有中间点。 反之，则将曲线按最大距离点分割

            if max_distance < self.threshold:

                self.qualify_list.append(point_list[-1])

                self.qualify_list.append(point_list[0])

            else:

                # 将曲线按最大距离的点分割成两段

                sequence_a = point_list[:max_distance_index]

                sequence_b = point_list[max_distance_index:]

                for sequence in [sequence_a, sequence_b]:

                    if len(sequence) < 3 and sequence == sequence_b:

                        self.qualify_list.extend(sequence[::-1])

                    else:

                        self.disqualify_list.append(sequence)

    def main(self, point_list):

        self.diluting(point_list)

        while len(self.disqualify_list) > 0:

            self.diluting(self.disqualify_list.pop())

        print self.qualify_list

        print len(self.qualify_list)

if __name__ == '__main__':

    d = DouglasPeuker()

    d.main([[104.066228, 30.644527], [104.066279, 30.643528], [104.066296, 30.642528], [104.066314, 30.641529],

            [104.066332, 30.640529], [104.066383, 30.639530], [104.066400, 30.638530], [104.066451, 30.637531],

            [104.066468, 30.636532], [104.066518, 30.635533], [104.066535, 30.634533], [104.066586, 30.633534],

            [104.066636, 30.632536], [104.066686, 30.631537], [104.066735, 30.630538], [104.066785, 30.629539],

            [104.066802, 30.628539], [104.066820, 30.627540], [104.066871, 30.626541], [104.066888, 30.625541],

            [104.066906, 30.624541], [104.066924, 30.623541], [104.066942, 30.622542], [104.066960, 30.621542],

            [104.067011, 30.620543], [104.066122, 30.620086], [104.065124, 30.620021], [104.064124, 30.620022],

            [104.063124, 30.619990], [104.062125, 30.619958], [104.061125, 30.619926], [104.060126, 30.619894],

            [104.059126, 30.619895], [104.058127, 30.619928], [104.057518, 30.620722], [104.057625, 30.621716],

            [104.057735, 30.622710], [104.057878, 30.623700], [104.057984, 30.624694], [104.058094, 30.625688],

            [104.058204, 30.626682], [104.058315, 30.627676], [104.058425, 30.628670], [104.058502, 30.629667],

            [104.058518, 30.630667], [104.058503, 30.631667], [104.058521, 30.632666], [104.057664, 30.633182],

            [104.056664, 30.633174], [104.055664, 30.633166], [104.054672, 30.633289], [104.053758, 30.633694],

            [104.052852, 30.634118], [104.052623, 30.635091], [104.053145, 30.635945], [104.053675, 30.636793],

            [104.054200, 30.637643], [104.054756, 30.638475], [104.055295, 30.639317], [104.055843, 30.640153],

            [104.056387, 30.640993], [104.056933, 30.641830], [104.057478, 30.642669], [104.058023, 30.643507],

            [104.058595, 30.644327], [104.059152, 30.645158], [104.059663, 30.646018], [104.060171, 30.646879],

            [104.061170, 30.646855], [104.062168, 30.646781], [104.063167, 30.646823], [104.064167, 30.646814],

            [104.065163, 30.646725], [104.066157, 30.646618], [104.066231, 30.645620], [104.066247, 30.644621], ])

垂距限值法

垂距限值法其实和DP算法原理一样，但是垂距限值不是从整体角度考虑，而是依次扫描每一个点，检查是否符合要求。

算法过程如下:

1、以第二个点开始，计算第二个点到前一个点和后一个点所在直线的距离d；
2、如果d大于阈值，则保留第二个点，计算第三个点到第二个点和第四个点所在直线的距离d;若d小于阈值则舍弃第二个点，计算第三个点到第一个点和第四个点所在直线的距离d;
3、依次类推，直线曲线上倒数第二个点。

下面是Python代码实现：

# -*- coding: utf-8 -*-

"""

-------------------------------------------------

  File Name：    LimitVerticalDistance

  Description :  垂距限值抽稀算法

  Author :        J_hao

  date：          2017/8/17

-------------------------------------------------

  Change Activity:

                  2017/8/17:

-------------------------------------------------

"""

from __future__ import division

from math import sqrt, pow

__author__ = 'J_hao'

THRESHOLD = 0.0001  # 阈值

def point2LineDistance(point_a, point_b, point_c):

    """

    计算点a到点b c所在直线的距离

    :param point_a:

    :param point_b:

    :param point_c:

    :return:

    """

    # 首先计算b c 所在直线的斜率和截距

    if point_b[0] == point_c[0]:

        return 9999999

    slope = (point_b[1] - point_c[1]) / (point_b[0] - point_c[0])

    intercept = point_b[1] - slope * point_b[0]

    # 计算点a到b c所在直线的距离

    distance = abs(slope * point_a[0] - point_a[1] + intercept) / sqrt(1 + pow(slope, 2))

    return distance

class LimitVerticalDistance(object):

    def __init__(self):

        self.threshold = THRESHOLD

        self.qualify_list = list()

    def diluting(self, point_list):

        """

        抽稀

        :param point_list:二维点列表

        :return:

        """

        self.qualify_list.append(point_list[0])

        check_index = 1

        while check_index < len(point_list) - 1:

            distance = point2LineDistance(point_list[check_index],

                                          self.qualify_list[-1],

                                          point_list[check_index + 1])

            if distance < self.threshold:

                check_index += 1

            else:

                self.qualify_list.append(point_list[check_index])

                check_index += 1

        return self.qualify_list

if __name__ == '__main__':

    l = LimitVerticalDistance()

    diluting = l.diluting([[104.066228, 30.644527], [104.066279, 30.643528], [104.066296, 30.642528], [104.066314, 30.641529],

            [104.066332, 30.640529], [104.066383, 30.639530], [104.066400, 30.638530], [104.066451, 30.637531],

            [104.066468, 30.636532], [104.066518, 30.635533], [104.066535, 30.634533], [104.066586, 30.633534],

            [104.066636, 30.632536], [104.066686, 30.631537], [104.066735, 30.630538], [104.066785, 30.629539],

            [104.066802, 30.628539], [104.066820, 30.627540], [104.066871, 30.626541], [104.066888, 30.625541],

            [104.066906, 30.624541], [104.066924, 30.623541], [104.066942, 30.622542], [104.066960, 30.621542],

            [104.067011, 30.620543], [104.066122, 30.620086], [104.065124, 30.620021], [104.064124, 30.620022],

            [104.063124, 30.619990], [104.062125, 30.619958], [104.061125, 30.619926], [104.060126, 30.619894],

            [104.059126, 30.619895], [104.058127, 30.619928], [104.057518, 30.620722], [104.057625, 30.621716],

            [104.057735, 30.622710], [104.057878, 30.623700], [104.057984, 30.624694], [104.058094, 30.625688],

            [104.058204, 30.626682], [104.058315, 30.627676], [104.058425, 30.628670], [104.058502, 30.629667],

            [104.058518, 30.630667], [104.058503, 30.631667], [104.058521, 30.632666], [104.057664, 30.633182],

            [104.056664, 30.633174], [104.055664, 30.633166], [104.054672, 30.633289], [104.053758, 30.633694],

            [104.052852, 30.634118], [104.052623, 30.635091], [104.053145, 30.635945], [104.053675, 30.636793],

            [104.054200, 30.637643], [104.054756, 30.638475], [104.055295, 30.639317], [104.055843, 30.640153],

            [104.056387, 30.640993], [104.056933, 30.641830], [104.057478, 30.642669], [104.058023, 30.643507],

            [104.058595, 30.644327], [104.059152, 30.645158], [104.059663, 30.646018], [104.060171, 30.646879],

            [104.061170, 30.646855], [104.062168, 30.646781], [104.063167, 30.646823], [104.064167, 30.646814],

            [104.065163, 30.646725], [104.066157, 30.646618], [104.066231, 30.645620], [104.066247, 30.644621], ])

    print len(diluting)

    print(diluting)

最后

其实DP算法和垂距限值法原理一样，DP算法是从整体上考虑一条完整的曲线，实现时较垂距限值法复杂，但垂距限值法可能会在某些情况下导致局部最优。另外在实际使用中发现采用点到另外两点所在直线距离的方法来判断偏离，在曲线弧度比较大的情况下比较准确。如果在曲线弧度比较小，弯曲程度不明显时，这种方法抽稀效果不是很理想，建议使用三点所围成的三角形面积作为判断标准。下面是抽稀效果:

博文地址: http://www.spiderpy.cn/blog/detail/29

曲线点抽稀算法-Python实现的更多相关文章

模拟退火算法Python编程（2）约束条件的处理
1.最优化与线性规划最优化问题的三要素是决策变量.目标函数和约束条件. 线性规划(Linear programming),是研究线性约束条件下线性目标函数的极值问题的优化方法,常用于解决利用现有的资 ...
模拟退火算法Python编程（3）整数规划问题
1.整数规划问题整数规划问题在工业.经济.国防.医疗等各行各业应用十分广泛,是指规划中的变量(全部或部分)限制为整数,属于离散优化问题(Discrete Optimization). 线性规划问题的 ...
pageRank算法 python实现
一.什么是pagerank PageRank的Page可是认为是网页,表示网页排名,也可以认为是Larry Page(google 产品经理),因为他是这个算法的发明者之一,还是google CEO( ...
常见排序算法-Python实现
常见排序算法-Python实现 python 排序算法 1.二分法 python 32行 right = length- : ] ): test_list = [,,,,,, ...
kmp算法python实现
kmp算法python实现 kmp算法 kmp算法用于字符串的模式匹配,也就是找到模式字符串在目标字符串的第一次出现的位置比如abababc那么bab在其位置1处,bc在其位置5处我们首先想到的最简单 ...
KMP算法-Python版
KMP算法-Python版传统法: 从左到右一个个匹配,如果这个过程中有某个字符不匹配,就跳回去,将模式串向右移动一位.这有什么难的? 我们可以 ...
压缩感知重构算法之IRLS算法python实现
压缩感知重构算法之OMP算法python实现压缩感知重构算法之CoSaMP算法python实现压缩感知重构算法之SP算法python实现压缩感知重构算法之IHT算法python实现压缩感知重构 ...
压缩感知重构算法之OLS算法python实现
压缩感知重构算法之OMP算法python实现压缩感知重构算法之CoSaMP算法python实现压缩感知重构算法之SP算法python实现压缩感知重构算法之IHT算法python实现压缩感知重构 ...
压缩感知重构算法之CoSaMP算法python实现
压缩感知重构算法之OMP算法python实现压缩感知重构算法之CoSaMP算法python实现压缩感知重构算法之SP算法python实现压缩感知重构算法之IHT算法python实现压缩感知重构 ...

随机推荐

Java程序设计模式系列之适配器模式
理解适配器设计模式需要从生活中的场景进行联系,在生活当中有那些东西能够称为适配器呢?从字面上理解,"适配"的意思就是让一个东西和另一个东西配对,能够让他们一起工作,比如大家用的笔记 ...
accp8.0转换教材第2章初识MySQL
首先安装MySQL: 一.单词部分: ①networking网络②option选择③port端口④firewall防火墙⑤engine引擎 ⑥standard标准⑦character字符⑧collat ...
深入理解Java虚拟机-----------虚拟机类加载机制
虚拟机类加载机制类从被加载到虚拟机内存开始,到卸载出内存为止,整个生命周期包括:加载,验证,准备,解析,初始化,使用,卸载等7个阶段.其中,验证,准备,解析3个部分称为连接. 以上7个阶段中,加载, ...
asp.net core新特性(1):TagHelper
进步,才是人应该有的现象.-- 雨果今天开始,我就来说说asp.net core的新特性,今天就说说TagHelper标签助手.虽然学习.net,最有帮助的就是microsoft的官方说明文档了,里 ...
Struts2框架05 result标签的类型
1 result标签是干什么的就是结果,服务器处理完返回给浏览器的结果:是一个输出结果数据的组件 2 什么时候需要指定result标签的类型把要输出的结果数据按照我们指定的数据类型进行处理 3 常 ...
SQL Server 2008R2的安装
一.安装前的准备工作:SQL Server 200R2安装包二.SQL Server2008R2的安装 1.打开SQL Server2008R2的安装包,找到setup.exe 2.双击sql se ...
Asp.Net Core 中无法使用 ConfigurationManager.AppSettings
刚刚接触.net core ,准备把之前的一些技术常用工具先移植到.net Standard上面来, 方便以后使用,结果用到ConfigurationManager 的 AppSettings 就出现 ...
父(Spring)子(SpringMVC)容器之初解篇
Spring和SpringMVC作为Bean管理容器和MVC层的默认框架,已被众多WEB应用采用,而在实际开发中,由于有了强大的注解功能,很多基于XML的配置方式已经被替代,但在实际项目中,我们经常会 ...
分享网上搜到的Oracle中对判定条件where 1=1的正解
今天在网上找到了Oracle中对判定条件where 1=1的正解,粘贴出来和大家分享下 1=1 是永恒成立的,意思无条件的,也就是说在SQL语句里有没有这个1=1都可以. 这个1=1常用于应用程序根据 ...
log4j（七）——log4j.xml简单配置样例说明
一:测试环境与log4j(一)--为什么要使用log4j?一样,这里不再重述二:老规矩,先来个栗子,然后再聊聊感受 (1)这里栗子有一点特别呀!给出了包名唉!想必有用,是的,配置文件中要特别说明一下 ...