基于GeoHash算法的附近点搜索实现(一)
1. 引入
最近在参加学校的计算机仿真大赛,时间好像有点不够,所以只完成了前面的一部分最基础的功能,中途还是选择了放弃。但是之前的部分的确觉得完成得还不错,在这里分享一下。题目是要完成一个宇宙飞船加油点的分配调度系统。完成的部分是给定坐标附近点的搜索。
2. 算法使用原因
我们要完成的一个是二维附近点搜索的算法。就是在给出若干个加油点的二维坐标,然后再给你一个当前坐标,你要搜索出距离当前坐标最近的一个加油站的坐标点。在考虑二维的附近点搜索时,最原始的方法肯定是将所有的加油点的坐标都加入到list
中.然后遍历所有的节点,判断哪个节点的坐标距离自己最近。但是这样操作的话,由于我们要进行多次的附近点搜索,这样每次搜索的成本就会相当大,比如我们搜索 N次,一共有 M 个加油点,复杂度将达到 N*M ,降低搜索效率。
所以我们应该降低每次的搜索效率。然后想过要使用建立哈希表进行搜索,这样成本基本花在了建表上,搜索所花费的时间就会少很多。但是按照自己的想法,去建一个哈希表的确比较困难,而且当地图比较大时,空间复杂度会十分的高,因此这种方法还是需要改进。然后我查阅了一些资料,参阅到一些附近点搜索的经典算法,也就是将要介绍的GeoHash算法。能够将坐标变成特定的编码,然后进行对应哈希,还能够根据编码的前缀,来进行判断两点是否在附近。
3. 算法介绍
在一篇很经典的文章中有所介绍GeoHash下附链接:
http://blog.nosqlfan.com/html/1811.html
此博客中,简要地说明GeoHash算法的思想:
- 将地图四分,也就是分成左上、右上、左下、右下四个部分,然后对应的地图块的编码后面追加
"01"
,"11"
,"00"
,"10"
|01|11|
|---|---|
|00|10| - 然后再将四分后的各个地图块,重复步骤1,不断地进行四分,编码也会两位两位地进行增加。直到地图块不能再进行四分。
- 得到对应的每个坐标的编码。
这就是GeoHash最基础的算法,能够将地图上的每个坐标点都进行编码。然后根据这些编码,很快就可以发现一个规律,因为是按着每个地图4分的,所以这地图四分前的编码是相同的,即使4分之后,这4块地图还是有着相同的前缀,因此,我们可以根据编码的最长相同前缀,去找出距离最近的加油站的坐标。
但是!这个算法还是有很大的缺点的:
由于GeoHash是将区域划分为一个个规则矩形,并对每个矩形进行编码,会导致以下问题,比如红色的点是我们的位置,绿色的两个点分别是附近的两加油点,但是在查询的时候会发现距离较远加油站的GeoHash编码与我们一样(因为在同一个GeoHash区域块上),而较近加油站的GeoHash编码与我们不一致。这个问题往往产生在边界处。
因此,我们需要对算法进行改进,解决的思路很简单,我们查询时,除了使用定位点的GeoHash编码进行匹配外,还使用周围8个区域的GeoHash编码,这样可以避免这个问题。
4. 需要解决的问题
- 坐标值转化为GeoHash编码值
- 根据当前区域的GeoHash,推算出周围8个方位区域块的的GeoHash值。
- 将这8个区域块中所有加油点进行储存,并且一一计算它们到当前坐标的距离,并且计算出最短距离的点。
- 考虑存储结构,以及算法实现。
5. 算法实现
因为项目开发的时候要可视化,所以当时就选择了使用C#。接下来的实现代码,都是C#编写的。
1. 坐标值转化为GeoHash
首先我们要知道当前地图大小为多少,取横坐标、纵坐标的中值,然后区分出4个区域,然后按照坐标所落到的区域,将对应的两位编号追加到地图的编码后,然后再将当前地图横坐标、纵坐标、都除以二,加上根据分块后地图改变的编号,以及坐标改变值,作为参数继续递归。递归结束的条件为地图的精度都已经减少为1的坐标的。
以下为实现代码:
//xb,yb分别为地图的横坐标和总坐标大小
//a,b,分别为给定点的横坐标、以及纵坐标
//code,为存储编码的字符串
public static void Encode(StringBuilder code, int xb, int yb, int a, int b)
{
if (xb == 1 && yb == 1)
return;
if (a < xb / 2 && b < yb / 2)
{
code.Append("00");
Encode(code, xb / 2, yb / 2, a, b);
}
else if (a < xb / 2 && b >= yb / 2)
{
code.Append("01");
Encode(code, xb / 2, yb / 2, a, b - yb / 2);
}
else if (a >= xb / 2 && b < yb / 2)
{
code.Append("10");
Encode(code, xb / 2, yb / 2, a - xb / 2, b);
}
else if (a >= xb / 2 && b >= yb / 2)
{
code.Append("11");
Encode(code, xb / 2, yb / 2, a - xb / 2, b - yb / 2);
}
return;
}
2. 根据当前的编码,计算其余8个方位的编码
这个的实现其实也很简单。首先,我们其实先只需要搜寻实现上下左右4个方位的编码,那么根据一些小组合,剩下的8个方位,也同样能够计算得到了。
那么我们就要计算4个方位毗邻的编码。情况其实也很简单。
有一些区域的上级区域,与自己并不相同,因此前缀也肯定不相同。所以我们判断到上级区域不相同时,就要进行对上级区域的转变。但是要对上级区域进行改变的时候,发现上级的上级区域也不同,那又要再深一层地去改变。这样一直下去,就会同样形成一个递归的过程。用语言很那解释,但是大家把各个坐标的编码表都计算出来并且显示后,就很容易能够找到规律。
下面贴上代码供大家参考。
public static void FindRight(StringBuilder code, int len)
{
if (len <= 0)
return;
if (code[len - 2] == '1')
{
FindRight(code, len - 2);
code[len - 2] = '0';
}
else
{
code[len - 2] = '1';
}
return;
}
public static void FindLeft(StringBuilder code, int len)
{
if (len <= 0)
return;
if (code[len - 2] == '0')
{
FindLeft(code, len - 2);
code[len - 2] = '1';
}
else
{
code[len - 2] = '0';
}
return;
}
public static void FindDown(StringBuilder code, int len)
{
if (len <= 0)
return;
if (code[len - 1] == '1')
{
FindDown(code, len - 2);
code[len - 1] = '0';
}
else
{
code[len - 1] = '1';
}
return;
}
public static void Findup(StringBuilder code, int len)
{
if (len <= 0)
return;
if (code[len - 1] == '0')
{
Findup(code, len - 2);
code[len - 1] = '1';
}
else
{
code[len - 1] = '0';
}
return;
}
基于GeoHash算法的附近点搜索实现(一)的更多相关文章
- 程序员编程艺术第三十六~三十七章、搜索智能提示suggestion,附近点搜索
第三十六~三十七章.搜索智能提示suggestion,附近地点搜索 作者:July.致谢:caopengcs.胡果果.时间:二零一三年九月七日. 题记 写博的近三年,整理了太多太多的笔试面试题,如微软 ...
- NASH:基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索,核心思想与之前的EAS方法类似,使用网络态射来生成一系列效果一致且继承权重的复杂子网,本文的网络态射更丰富,而且仅需要简单的爬山算法辅助就可以完成搜索,耗时 ...
- 故障定位之查找附近点GeoHash研讨
随着移动终端的普及,很多应用都基于LBS功能,附近的某某(餐馆.银行.妹纸等等). 基础数据中,一般保存了目标位置的经纬度:利用用户提供的经纬度,进行对比,从而获得是否在附近. 目标:查找附近的XXX ...
- 基于改进人工蜂群算法的K均值聚类算法(附MATLAB版源代码)
其实一直以来也没有准备在园子里发这样的文章,相对来说,算法改进放在园子里还是会稍稍显得格格不入.但是最近邮箱收到的几封邮件让我觉得有必要通过我的博客把过去做过的东西分享出去更给更多需要的人.从论文刊登 ...
- CARS: 华为提出基于进化算法和权值共享的神经网络结构搜索,CIFAR-10上仅需单卡半天 | CVPR 2020
为了优化进化算法在神经网络结构搜索时候选网络训练过长的问题,参考ENAS和NSGA-III,论文提出连续进化结构搜索方法(continuous evolution architecture searc ...
- 查找附近网点geohash算法及实现 (Java版本号)
參考文档: http://blog.csdn.net/wangxiafghj/article/details/9014363geohash 算法原理及实现方式 http://blog.charlee ...
- geohash算法原理及实现方式
1.geohash特点 2.geohash原理 3.geohash的php .python.java.C#实现代码 4.观点讨论 w微博:http://weibo.com/dxl0321 geohas ...
- geohash 算法原理及实现方式
转自:http://www.cnblogs.com/dengxinglin/archive/2012/12/14/2817761.html geohash 算法原理及实现方式 1.geohash 特点 ...
- 【智能算法】迭代局部搜索(Iterated Local Search, ILS)详解
迭代局部搜索(Iterated Local Search, ILS) 源代码下载请关注微信公众号[程序猿声],在后台回复:[ILS],不包括[]即可下载. 00 目录 局部搜索算法 简单局部搜索 迭代 ...
随机推荐
- POJ 1696 Space Ant(点积的应用)
Space Ant 大意:有一仅仅蚂蚁,每次都仅仅向当前方向的左边走,问蚂蚁走遍全部的点的顺序输出.開始的点是纵坐标最小的那个点,開始的方向是開始点的x轴正方向. 思路:从開始点開始,每次找剩下的点中 ...
- New Hire Training Experience
Game Description: 1. In a closed door, there will be a circle, and 30 numbers in the circle. 2. Each ...
- [Oracle] 接线表
于OLTP制,嵌套连接占70%左右,哈希联接占20%,合并排序连接帐户10%. 嵌套连接 算法:嵌套连接从两个表分选出小表为驱动表,大表为被驱动表.先訪问驱动表(仅仅訪问1次).然后依据驱动表返回的行 ...
- UNIX网络编程卷1 server程序设计范式7 预先创建线程,以相互排斥锁上锁方式保护accept
本文为senlie原创.转载请保留此地址:http://blog.csdn.net/zhengsenlie 1.预先创建一个线程池.并让每一个线程各自调用 accept 2.用相互排斥锁代替让每一个线 ...
- python学习笔记之四:条件,循环和其他语句
前面已经介绍过几种基本语句(print,import,赋值语句),下面我们来介绍条件语句,循环语句. 一. print和import的更多信息 1.1 使用逗号输出 A.打印多个表达式,用逗号隔开,会 ...
- jQuery中间each实施例的方法
$.each()和$(selector).each()很阶段似,但它是不一样的. 前者可用于遍历数组或json对象 后者被设计成遍历jQuery对象 第一个是$.each()对,通常这么用 $.eac ...
- javascript - 浏览TOM大叔博客的学习笔记
part1 ---------------------------------------------------------------------------------------------- ...
- Linux 软连接与硬连接
Linux 软连接与硬连接 对于一个文件来说,有唯一的索引接点与之相应,而对于一个索引接点号,却能够有多个文件名称与之相应.因此,在磁盘上的同一个文件能够通过不同的路径去訪问该文件.注意在Linux下 ...
- cocos2d触摸事件处理机制(2.x和3.x变化)
2.x的触摸事件的版本号 触摸事件处理有2种子.以下单点触摸的样本.(另一种多点触摸屏). 创建cocos2d 该项目. 1. 重写下面虚函数. bool ccTouchBegan(cocos2d:: ...
- C语言简单的菜单选项
#include <stdio.h> char get_choice(void); char get_first(void); int get_int(void); void count( ...