1. 为什么要选择ElasticSearch

1)ElasticSearch

优点:

分布式、实时的、Push replication

完全支持Apache Lucene的接近实时的搜索

处理多租户(multitenancy)不需要特殊配置,而Solr则需要更多的高级设置

Gateway概念,使备份更加简单

各节点组成对等的网络结构,某些节点出现故障时会自动分配其他节点代替其进行工作

缺点:

只有一名开发则

还不够自动,不适合当前新的Index Warmup API(热索引)

2)Solr

优点:

Solr有一个更成熟的社区

支持多种格式的索引

Solr比较成熟、稳定

不考虑建索引的同时进行搜索,速度更快

缺点:

建立索引时,搜索效率下降,实时索引搜索效率不高

缺点:

建立索引时,搜索效率下降,实时索引搜索效率不高。

2. 浅析ElasticSearch工作原理

1)Lucence,基本架构,解决方案

Document 行(Row)文本

Index索引(数据关键值)->提高查询效率

Analyzer分词器(打标签)->提高查询精准度

3. 查询附近的人功能实现思路

操作流程:

1)利用GPS设备获取每个人的位置(经纬度坐标),然后上传到服务器

2)根据Tom的位置,利用大数据搜索引擎实时搜索出附近的人,列出其个人信息

3)实现条件筛选,只看女生或者只看男生

代码实现:

1)利用ES搜索引擎随机生成10W条模拟数据

2)设置Tom所在位置

3)从模拟数据中匹配出符合条件的人

4)开始加人,聊天

4. 从10w条记录中快速搜索附近的人

对比学习

数据库:建库(DB),建表(Table),建约束

JDBC API:加载驱动类,建立连接(客户端),建立语句集SQL,执行语句集,获取结果集(ResultSet),关闭结果、语句、连接

ES:建库(Index),建表(IndexType),主键

ES API:建立连接(创建客户端TransportClient),查询构造器(构造查询条件Request),执行语句集(execute),获取结果集(Response)、关闭以上诸操作

geo 自动运用GEO算法,经纬度换算成距离(m, km)

5. 使用ES需要注意的地方

1)Lucence版本差异

2)ElasticSearch各版本差异

【沽泡学院07】基于ElasticSearch搜索附近的人的更多相关文章

  1. 基于Elasticsearch搜索平台设计

    背景 随着公司业务的高速发展以及数据爆炸式的增长,当前公司各产线都有关于搜索方面的需求,但是以前的搜索服务系统由于架构与业务上的设计,不能很好的满足各个业务线的期望,主要体现下面三个问题: 不能支持对 ...

  2. ElasticStack学习(六):ElasticSearch搜索初探

    一.ElasticSearch搜索介绍 1.ElasticSearch搜索方式主要分为以下两种: 1).URI Search:此种查询主要是使用Http的Get方法,在URL中使用查询参数进行查询: ...

  3. Elasticsearch搜索调优权威指南 (2/3)

    本文首发于 vivo互联网技术 微信公众号 https://mp.weixin.qq.com/s/AAkVdzmkgdBisuQZldsnvg 英文原文:https://qbox.io/blog/el ...

  4. Elasticsearch搜索资料汇总

    Elasticsearch 简介 Elasticsearch(ES)是一个基于Lucene 构建的开源分布式搜索分析引擎,可以近实时的索引.检索数据.具备高可靠.易使用.社区活跃等特点,在全文检索.日 ...

  5. 看完这篇还不会 Elasticsearch 搜索,那我就哭了!

    本文主要介绍 ElasticSearch 搜索相关的知识,首先会介绍下 URI Search 和 Request Body Search,同时也会学习什么是搜索的相关性,如何衡量相关性. Search ...

  6. 一次 ElasticSearch 搜索优化

    一次 ElasticSearch 搜索优化 1. 环境 ES6.3.2,索引名称 user_v1,5个主分片,每个分片一个副本.分片基本都在11GB左右,GET _cat/shards/user 一共 ...

  7. ElasticSearch搜索介绍四

    ElasticSearch搜索 最基础的搜索: curl -XGET http://localhost:9200/_search 返回的结果为: { "took": 2, &quo ...

  8. php根据汉字获取拼音(php基于拼音搜索实现原理)

    php根据汉字获取拼音(php基于拼音搜索实现原理) 代码一:获取字符串汉字首字母,兼容GBK和UTF-8 <?php function getfirstchar($s0){   //获取单个汉 ...

  9. Elasticsearch搜索结果返回不一致问题

    一.背景 这周在使用Elasticsearch搜索的时候遇到一个,对于同一个搜索请求,会出现top50返回结果和排序不一致的问题.那么为什么会出现这样的问题? 后来通过百度和google,发现这是因为 ...

随机推荐

  1. MySQL mysqldump 备份脚本(按照db.sql)

    mysqldump逻辑备份,按照db.sql文件区分,并压缩 #! /bin/bash #35 02 * * * mysql /data/mysqldata/scripts/mysqldump_per ...

  2. Oracle 静默安装oracle client

    静默安装oracle clint比较简单,修改instantclient.crsp文件的几个位置即可 [root@localhost ~]# vi /etc/oralnstloc inventory_ ...

  3. [置顶] 自己写一个简单通用的Makefile

    转自:http://blog.csdn.net/u011913612/article/details/52102241 一.makefile的作用 Makefile是用于自动编译和链接的,一个工程有很 ...

  4. BIOS简单设置 解析“集成显卡”内存占用问题

    很多使用集成显卡的用户会发现,在系统信息窗口中,内存容量和实际不一样.比如系统内存显示4GB,可用3.48G之类.这不可用的一部分内存到哪去了? 其实减少的这部分内存是被集成显卡占用当做显存使用了.而 ...

  5. Python函数(十)-装饰器(三)

    如果多个函数想通过一个装饰器来实现不同的功能的话,可以给装饰器传入参数,让装饰器里的函数对参数进行判断,来实现不同的功能 # -*- coding:utf-8 -*- __author__ = &qu ...

  6. 第十章 深入理解Session与Cookie

    理解Cookie 理解Session Cookie安全问题 分布式Session框架 Cookie压缩 表单重复提交问题 多终端Session统一

  7. linux 权限 homework

    作业一: 1) 新建用户natasha,uid为1000,gid为555,备注信息为“master” useradd natasha -u 1000 -g 555 -c "master&qu ...

  8. LAMP 2.8 php.ini配置文件详解

    修改php配置文件,但有时候我们并不知道 php.ini 所在路径,这时候就需要通过命令来查一查在哪里. /usr/local/php/bin/php -i |head 看那一行 Loaded Con ...

  9. C#WinForm如何调整控件的Tab按键顺序

    在日常生活中,很多用户都会有使用Tab键的习惯.而在C#的WinForm开发中,Tab按键的顺序默认是你拖拽进窗体的顺序.那么我们如何修改这个顺序呢?答案如下(以VS2010为例). 只需要点击[视图 ...

  10. mahout in Action研读(1)-给用户推荐图书

    1.mahout in Action2.2第一个例子   Running a first recommender engine   数据: 第一个数字是用户ID 第二个是书的ID,第三个是用户对书的评 ...