转自基于R-Tree的最近邻查询

BAB(Branch.and.Band)算法是由Nick Roussopoulousnl等人于1995年提出的,是最早的基于R.树的静态最近邻查询算法。该算法使用MINDIST和MINMAXDIST两个距离作为查询过程中的判断条件,对R树进行深度优先

搜索以查找最近邻,适用于基于静态对象的最近邻搜索。BAB思想已经被广泛的应用于人工智能以及运筹学等领域。如果搜索顺序和剪枝的规则选取适当,可以有效的减少系统在大规模空间搜索过程中的结点访问数目。

一、The MBR Face Property

Lemma:Every face of any MBR contains at least one point of an
actual spatial object 如图:

二、距离度量MINDIST和MINMAXDIST

为了减少计算量,文中的距离都以实际欧式距离的平方为标准。

给定一个查询点p及包含在一个MBR中的空间数据对象O,定义两个距离MINDIST和MINMAXDIST作为最近邻的度量和约束。其中:

MINDIST(P,R):  the shortest distance from P to R

MINMAXDIST(P,R):the minimum over all dimensions distance from P  to the furthest point of the closest face of the R

Theorem:

1. Any object O in R has distance from P that is at least as large as MINDIST

2.There exists at least one object within R with distance <= to MINMAXDIST

so:

MINDIST(P,R)  <=  NN(P)  <=  MINMAXDIST(P,R)            (1)

三、MINDIST和MINMAXDIST的计算

    MINDIST:

1.查询点p在R内或R的边界上则MINDIST=0

2.查询点p在R外,若最短距离距离(p到R的边)存在,则MINDIST=p到R的边的最短距离

否则,MINDIST=p到R的顶点的最短最短距离。

MINMAXDIST的计算过程:

1.找出与第k轴垂直的并且离查询点p最近的面,记为H

2.选择从查询点p到面H中距离最远的那个点,记为a

3.计算查询点p到点a的距离,记为dk

4.对每个坐标轴重复步骤1-步骤3,记计算所得距离为d1,d2,...dk

5.从所有计算所得距离中选出最小的那一个,即MINMAXDIST

例如:下图中查询点p在外接矩形R之外,根据上面的计算步骤我们可得:

X轴:找到点(4,8,12)  计算p到此点的距离的平方dx=185

y轴:找到点(13,2,12) 计算p到此点的距离的平方dy=313

z轴:找到点(13,8,4)  计算p到ci点的距离的平方dz=210

所以此例中的MINMAXDIST(p,R)=185

下图表示了二维空间中点P与几个最小包含矩形MBR的MINDIST和MINMAXDIST的一个例子。二维空间中共有四个MBR,点P到它们的MINDIST和MINMAxDIST值在图中用箭头标出。如果点P位于MBR内部MINDIST值为0。

下图表示了三维空间中的MINDIST和MINMAXDIST。

四、减枝策略

由以上讨论,剪枝过程按以下三种策略进行:

1.若一个最小包含矩形E的MINDIST值大于另一个最小包含矩形E’的MINMAXDIST值,则最小包含矩形E内不可能包含最近邻对象。所以E可以被忽略。该策略用于向下剪枝。

2.若查询点q到某对象O的距离值大于点q到最小包含矩形E的MINMAXDIST的值则对象O被丢弃。因为最小包含矩形层此时包含距离查询点口更近的对象O’。该策略用于向上剪枝。

3.若最小包含矩形E的MINDIST值大于查询点g到某对象O的距离,则E被丢弃,因为最小包含矩形E内部不可能包含比对象O更近的对象。该策略用于向上剪枝。

尽管规定在向下剪枝时用MINMAXDIST进行判断,然而在某些情况下使用MINDIST效果会更好。例如当R树的结点中不存在死区或者死区很少时,在R树的某一层上MINDIST相对于MINMAxDIST而言是查询点到最近邻对象实际距离的更好估计。此时使用MINDIST可以剪掉更多无关的候选MBR。

五、Branch and Bound算法

该算法从根结点开始向下访问各层MBR。算法中首先假定最近邻距离Nearest为无穷大。随着搜索的下降,对每个最新访问的非叶结点首先计算出其中所有的MBR的MINDIST值,并将这些值排序后放入活动分支链表ABL(Active
Branch
List)中,接着对ABL运用剪枝策略1和策略2来移除不必要的分支。算法在ABL上重复进行直至ABL为空。每次重复过程中都选择链表中的下一个分支,并在与该分支的MBR相应的结点上递归进行以上过程。对于叶结点算法对每个对象调用一个特定类型的距离函数,并将计算出的值逐个与Nearest比较,选择其中更小的值替换Nearest。在递归过程返回时使用这个新的最近邻距离的估计值作为判断条件,采用策略3剪枝以移除ABL中所有MINDIST值大子Nearest的MBR所在的分支。

算法伪代码:

参考:

Nearest Neighborhood Queries.Nick Roussopoulos等.

http://www.doc88.com/p-146668818114.html

http://zh.scribd.com/doc/73414427/32/Fig-4-4-Example-of-MINDIST-and-MINMAXDIST

基于R-Tree的最近邻查询的更多相关文章

  1. 基于R树索引的点面关系判断以及效率优化统计

    文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景 在之前的博客中,我分别介绍了基于网格的空间索引(http:// ...

  2. 基于Impala平台打造交互查询系统

    本文来自网易云社区 原创: 蒋鸿翔 DataFunTalk 本文根据网易大数据蒋鸿翔老师DataFun Talk--"大数据从底层处理到数据驱动业务"中分享的<基于Impal ...

  3. SQLite R*Tree 模块测试

    目录 SQLite R*Tree 模块测试 1.SQLite R*Tree 模块特性简介 2.SQLite R*Tree 模块简单测试代码 SQLite R*Tree 模块测试 相关参考: MySQL ...

  4. 【转载】 使用Anemometer基于pt-query-digest将MySQL慢查询可视化

    原文地址:使用Anemometer基于pt-query-digest将MySQL慢查询可视化 作者:84223932 本文主要介绍使用Anemometer基于pt-query-digest将MySQL ...

  5. 统计学习导论:基于R应用——第二章习题

    目前在看统计学习导论:基于R应用,觉得这本书非常适合入门,打算把课后习题全部做一遍,记录在此博客中. 第二章习题 1. (a) 当样本量n非常大,预测变量数p很小时,这样容易欠拟合,所以一个光滑度更高 ...

  6. 概率图模型 基于R语言 这本书中的第一个R语言程序

    概率图模型 基于R语言 这本书中的第一个R语言程序 prior <- c(working =0.99,broken =0.01) likelihood <- rbind(working = ...

  7. 基于R语言的时间序列指数模型

    时间序列: (或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列.时间序列分析的主要目的是根据已有的历史数据对未来进行预测.(百度百科) 主要考虑的因素: 1.长期趋势(Lon ...

  8. 基于R语言的ARIMA模型

    A IMA模型是一种著名的时间序列预测方法,主要是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型.ARIMA模型根据原序列是否平稳以及 ...

  9. django之 使用views.py里面的函数对表进行增删改查 内容(models.py中表的创建、views.py中函数的使用,基于对象的跨表查询)

    models之对于表的创建有以下几种: 一对一:ForeignKey("Author",unique=True),  OneToOneField("Author" ...

随机推荐

  1. React初识整理(三)--受控组件解决方法

    1. 受控组件:组件处于受控制状态,不可更改输入框内的值. 2. 什么情况下会让组件变成受控组件? - 文本框设置了value属性的时候 - 单选框或多选框设置了checked属性的时候. 3. 如何 ...

  2. Windows平台下使用vs code搭建python3环境(1)

    前言:最近几周在使用python开发的过程中,碰到了好多坑,由于以前使用visual studio 2015习惯了,导致刚开始搭建python开发环境以及管理各种包的时候有点不习惯,再加上python ...

  3. 数据库事务ACID和事务的隔离级别

    借鉴:https://blog.csdn.net/zh521zh/article/details/69400053和https://blog.csdn.net/May_3/article/detail ...

  4. APIO2019&&THUSC2019游记

    APIO2019懵十三记: day0: 早上和ljx从沈阳出发,下午一点到的首师大附. 由于工作人员中午十二点就散了,我们就先去试机了. 下午三点接到狗牌和T恤,晚上买麦当劳回如意吃. 晚上还有场模拟 ...

  5. 绑定用户id,用户权限认证

    上面这个就是为了把user_id与文章关联起来 文章需要跟用户关联,所以要去文章模型中加以关联 这样就可以直接在模板中进行关联处理 权限认证 首先要创建policy php artisan make: ...

  6. pymongo的简单使用

    pymongo的使用 首先安装: pip install pymongo 安装好了使用 import pymongo # 链接mongodb,得到一个mongoclient的客户端对象 client ...

  7. 【Oracle】使用dblink+minus方式迁移数据

    一.需求说明 1.数据库a104的表syssde.a4_syssde_department中有1000条数据: 2.数据库a230的表syssde.a4_syssde_department中有800条 ...

  8. python接口自动化测试二十七:密码MD5加密

    # MD5加密 # 由于MD5模块在python3中被移除# 在python3中使用hashlib模块进行md5操作import hashlib def MD5(str): # 创建md5对象 hl ...

  9. python 中zip()函数的使用

    zip(*iterables)函数的定义: zip()函数的对象Iterables,iterables可以有多个参数(元组,列表等可迭代对象)组成.通过zip()函数返回一组元组数据,每个元组中的第i ...

  10. WPF之DataAnnotations 注解说明

    参考:https://www.cnblogs.com/yaosuc/p/4527886.html 1.基础验证: using System.ComponentModel.DataAnnotations ...