KD Tree算法

参考：http://blog.csdn.net/v_july_v/article/details/8203674

#!/user/bin/env python

# -*- coding:utf8 -*-

__author__ = 'zky@msn.cn'

import sys

import numpy

import heapq

import Queue

class KDNode(object):

    def __init__(self, name, feature):

        self.name = name

        self.ki = -1

        self.is_leaf = False

        self.feature = feature

        self.kd_left = None

        self.kd_right = None

    def traverse(self, seq, order='in'):

        if order == 'in':

            if self.kd_left:

                self.kd_left.traverse(seq, order)

            seq.append(self)

            if self.kd_right:

                self.kd_right.traverse(seq, order)

        elif order == 'pre':

            seq.append(self)

            if self.kd_left:

                self.kd_left.traverse(seq, order)

            if self.kd_right:

                self.kd_right.traverse(seq, order)

        elif order == 'post':

            if self.kd_left:

                self.kd_left.traverse(seq, order)

            if self.kd_right:

                self.kd_right.traverse(seq, order)

            seq.append(self)

        else:

            assert(False)

class NodeDistance(object):

    def __init__(self, kd_node, distance):

        self.kd_node = kd_node

        self.distance = distance

    # here i use a reversed result, because heapq can support only min heap

    def __cmp__(self, other):

        ret = other.distance - self.distance

        if ret > 0:

            return 1

        elif ret < 0:

            return -1

        else:

            return 0

def euclidean_distance(node1, node2):

    assert len(node1.feature) == len(node2.feature)

    sum = 0

    for i in xrange(len(node1.feature)):

        sum += numpy.square(node1.feature[i] - node2.feature[i])

    return numpy.sqrt(sum)

class KDTree(object):

    # n is num of dimension

    def __init__(self, nodes, n):

        self.root = self.build_kdtree(nodes, n)

        self.n = n

    def build_kdtree(self, nodes, n):

        if len(nodes) == 0:

            return None

        max_var = 0

        index = 0

        for i in xrange(n):

            features_n = map(lambda node : node.feature[i], nodes)

            var = numpy.var(features_n)

            if var > max_var:

                max_var = var

                index = i

        sorted_nodes = sorted(nodes, key=lambda node: node.feature[index])

        mid = len(sorted_nodes)/2

        root = sorted_nodes[mid]

        left_nodes = sorted_nodes[:mid]

        right_nodes = sorted_nodes[mid+1:]

        root.ki = index

        if len(left_nodes) == 0 and len(right_nodes) == 0:

            root.is_leaf = True

        root.kd_left = self.build_kdtree(left_nodes, n)

        root.kd_right = self.build_kdtree(right_nodes, n)

        return root

    def traverse_kdtree(self, order='in'):

        seq = []

        self.root.traverse(seq, order)

        print map(lambda n : n.name, seq)

    # return a list of NodeDistance sorded by distance

    def kdtree_bbf_knn(self, target, k):

        if len(target.feature) != self.n:

            return None

        knn = []

        priority_queue = Queue.LifoQueue()

        priority_queue.put(self.root)

        while not priority_queue.empty():

            expl = priority_queue.get()

            while expl:

                ki = expl.ki

                kv = expl.feature[ki]

                if expl.name != target.name: # ignore target node itself

                    # save a maybe result

                    distance = euclidean_distance(expl, target)

                    nd = NodeDistance(expl, distance)

                    assert len(knn) <= k

                    if len(knn) == k:

                        if distance < knn[0].distance:

                            heapq.heapreplace(knn, nd)

                    else: # len(knn) < k

                        heapq.heappush(knn, nd)

                unexpl = None

                # find next expl

                if target.feature[ki] <= kv: # left

                    unexpl = expl.kd_right

                    expl = expl.kd_left

                else:

                    unexpl = expl.kd_left

                    expl = expl.kd_right

                # ignore nodes over a long distance bin

                if unexpl:

                    # save a maybe next expl

                    if len(knn) < k:

                        priority_queue.put(unexpl)

                    elif (len(knn) == k) and (abs(kv - target.feature[ki]) < knn[0].distance):

                        priority_queue.put(unexpl)

        ret = []

        for i in xrange(len(knn)):

            node = heapq.heappop(knn)

            ret.insert(0, node)

        return ret

if __name__ == '__main__':

    f1 = [7, 2]

    f2 = [5, 4]

    f3 = [9, 6]

    f4 = [2, 3]

    f5 = [4, 7]

    f6 = [8, 1]

    fx = [2, 4.5]

    n1 = KDNode('f1', f1)

    n2 = KDNode('f2', f2)

    n3 = KDNode('f3', f3)

    n4 = KDNode('f4', f4)

    n5 = KDNode('f5', f5)

    n6 = KDNode('f6', f6)

    nx = KDNode('fx', fx)

    n1_distance = NodeDistance(n4, 1.5)

    n2_distance = NodeDistance(n5, 3.2)

    n3_distance = NodeDistance(n2, 3.04)

    assert n1_distance > n2_distance

    assert n1_distance > n3_distance

    assert n2_distance < n3_distance

    tree = KDTree([n1, n2, n3, n4, n5, n6, nx], 2)

    tree.traverse_kdtree('in')

    knn = tree.kdtree_bbf_knn(nx, 3)

    print map(lambda n : (n.kd_node.name, n.distance), knn)

KD Tree算法的更多相关文章

K-D TREE算法原理及实现
博客转载自:https://leileiluoluo.com/posts/kdtree-algorithm-and-implementation.html k-d tree即k-dimensional ...
【数据结构与算法】k-d tree算法
k-d tree算法 k-d树(k-dimensional树的简称),是一种分割k维数据空间的数据结构.主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索). 应用背景 SIFT算法中做特征点 ...
k-d tree算法
k-d树(k-dimensional树的简称),是一种分割k维数据空间的数据结构.主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索). 应用背景 SIFT算法中做特征点匹配的时候就会利用到k ...
Kd Tree算法详解
kd树(k-dimensional树的简称),是一种分割k维数据空间的数据结构,主要应用于多维空间关键数据的近邻查找(Nearest Neighbor)和近似最近邻查找(Approximate Nea ...
k-d tree 学习笔记
以下是一些奇怪的链接有兴趣的可以看看: https://blog.sengxian.com/algorithms/k-dimensional-tree http://zgjkt.blog.uoj.ac ...
K-D Tree题目泛做（CXJ第二轮）
题目1: BZOJ 2716 题目大意:给出N个二维平面上的点,M个操作,分为插入一个新点和询问到一个点最近点的Manhatan距离是多少. 算法讨论: K-D Tree 裸题,有插入操作. #inc ...
［转载］kd tree
[本文转自]http://www.cnblogs.com/eyeszjwang/articles/2429382.html k-d树(k-dimensional树的简称),是一种分割k维数据空间的数据 ...
【学习笔记】K-D tree 区域查询时间复杂度简易证明
查询算法的流程如果查询与当前结点的区域无交集,直接跳出. 如果查询将当前结点的区域包含,直接跳出并上传答案. 有交集但不包含,继续递归求解. K-D Tree 如何划分区域可以借助下文图片理解. ...
AOJ DSL_2_C Range Search (kD Tree)
Range Search (kD Tree) The range search problem consists of a set of attributed records S to determi ...

随机推荐

win8.1安装开发工具vs2013.3+mssql2012全程
几个常用的命令重起计算机命令:shoutdown.exe -r -t 0 立刻重起在远程桌面中没有关机重起的选项,这个命令是必须的远程桌面连接:mstsc 硬件环境:I7 4770 64RAM ...
Linq专题之创建Linq查询表达式
本节我们主要介绍一下如何创建查询集合类型,关系数据库类型,DataSet对象类型和XML类型的数据源的Linq查询表达式. 下面在实例代码ReadyCollectionData()函数创建了准备的数据 ...
使用innerHTML获取HTML代码时，HTML标记属性的双引号好多都消失不见了，原来是属性值中包含空格才会保留双引号
最近搞的一个项目中所使用的方式比较奇怪,用Label显示HTML内容,然后不断地使用JS把Label的innerHTML复制到TextBox中. 但是,昨天发现了一个问题,获取元素值的时候,有时候正常 ...
foreach---集合已修改；可能无法执行枚举操作。
小结 : foreach是取只读的,在取的时候数据不能变(包括修改,删除,添加等).要避免这个问题,就应该使用for循环--- 原因: 当用foreach遍历Collection时,如果对Collec ...
第二章--Win32程序运行原理（部分概念及代码讲解）
学习<Windows程序设计>记录概念贴士: 1. 每个进程都有赋予它自己的私有地址空间.当进程内的线程运行时,该线程仅仅能够访问属于它的进程的内存,而属于其他进程的内存被屏蔽了起来,不 ...
基于 ANSIBLE 自动化运维实践
摘要:运维这个话题很痛苦,你做任何的产品都离不开运维.不管你用什么语言.什么平台.什么技术,真正能够决定你产品成熟度的很有可能就是你运维的能力.取自云巴 CEO 张虎在 ECUG 大会上的分享. 云 ...
jquery.ajax error调试
$(document).ready(function() { jQuery("#clearCac").click(function() { jQuery.ajax({ url: u ...
Python数学运算的一个小算法（求一元二次方程的实根）
请定义一个函数quadratic(a, b, c),接收3个参数,返回一元二次方程:ax² + bx + c = 0的两个解. #!/usr/bin/env python # -*- coding: ...
给我一个及时的问候——XMPP
XMPP总的来说就是:基于XML数据结构,点对点的,及时通讯协议是 Linux操作系统+Apache软件+mySql数据库 + php 编程语言组成开始时要导入 XMPPFrameWork框 ...
Gulp-前端进阶A-3---如何不刷新监控文件变化？
npm install --save-dev gulp-connect npm install --save-dev gulp-livereload npm其他,前面已有 var gulp = req ...

KD Tree算法

KD Tree算法的更多相关文章

随机推荐

热门专题