索引(index) —— 存储关联数据的地方。实际上,索引只是一个逻辑命名空间(logical namespace),它指向一个或多个分片(shards)。

分片(shard) 是 工作单元(worker unit) 底层的一员,分片是一个独立的Lucene实例既可,并且它自身也是一个完整的搜索引擎

,它只负责保存索引中所有数据的一小片。

分片分为 主分片(primary shard) 以及 从分片(replica shard) 两种。

在你的索引中,每一个文档都属于一个主分片,所以具体有多少主分片取决于你的索引能存储多少数据。

从分片只是主分片的一个副本,它用于提供数据的冗余副本,在硬件故障时提供数据保护,同时服务于搜索和检索这种只读请求。

索引中的主分片的数量在索引创建后就固定下来了,但是从分片的数量可以随时改变。

Client

对于JAVA,Elasticsearch 提供了两个客户端

节点客户端(Client Node)节点客户端以一个无数据的节点(node.master: false,node.data: false )的身份加入了一个集群,但是他知道什么数据在集群中的哪一个节点上,然后就可以请求转发到正确的节点上并进行连接。

传输客户端(Transport Client)传输客户端不加入集群本身,通过向远程集群发送请求来通讯。

这两个客户端都使用 Elasticsearch 的传输协议,通过9300端口与 java 客户端进行通信。集群中的各个节点也是通过9300端口进行通信。

其他的语言可以通过9200端口与 Elasticsearch 的 RESTful API 进行通信。

创建Client

Settings settings = Settings.settingsBuilder()
.put("cluster.name", "es-cluster").build();
Client client = TransportClient.builder().settings(settings).build()
.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("10.9.22.35"), 9301))
.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("10.9.22.35"), 9302))
.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("10.9.22.35"), 9303));

Client Settings

cluster.name 集群名称,如果不为“elasticsearch” 需要在创建client时指定

client.transport.sniff 开启集群嗅探功能,探测集群中节点的添加与删除

client.transport.ignore_cluster_name 设置为true忽略连接的节点集群名称验证

client.transport.ping_timeout Ping一个节点响应超时时间 默认5s

client.transport.nodes_sampler_interval 多长时间间隔尝试ping和连接Node节点 默认5s

异常:

  1. not part of the cluster Cluster [elasticsearch], ignoring...
  2. org.elasticsearch.client.transport.NoNodeAvailableException: No node available

    因为没有指定集群名称,指定后解决。

Index

你可能发现在 Elasticsearch 中,索引这个词汇已经被赋予了太多意义,所以在这里我们有必要澄清一下:

索引 (名词)

如上文所说,一个 索引 就类似于传统关系型数据库中的 数据库。这里就是存储相关文档的的地方。

索引 (动词)

为一个文档创建索引 是把一个文档存储到一个索引(名词)中的过程,这样它才能被检索。这个过程非常类似于 SQL 中的 INSERT 命令,如果已经存在文档,新的文档将会覆盖旧的文档。

反向索引

在关系数据库中的某列添加一个 索引,比如多路搜索树(B-Tree)索引,就可以加速数据的取回速度, Elasticsearch 以及 Lucene 使用的是一个叫做 反向索引(inverted index) 的结构来实现相同的功能。

Index Api 允许将一个Json文档索引到一个特定的索引中并可以搜索到

  List<BcShop> list = new ArrayList<BcShop>();
list.add(new BcShop(1936212235,"鑫釜山铁桶海鲜烧烤(霄云路店)","霄云路15号","010-64388850",new Date()));
list.add(new BcShop(515636,"眉州东坡酒楼(中关村店)","中关村大街27号中关村大厦2层(地铁海淀黄庄站北)","010-59683322",new Date()));
list.add(new BcShop(19604619,"辣家私厨(百子湾店)","黄木厂路六号D座(今日美术馆对面)","010-87781377",new Date()));
list.add(new BcShop(22974252,"脑馋粉儿(三里屯店","三里屯SOHO商场5 B1-506(下沉广场直行150米左侧)","010-58494433",new Date()));
list.add(new BcShop(510689,"金百万烤鸭店(马甸店)","马甸裕民路3号(牡丹园)","010-62380012",new Date()));
list.add(new BcShop(512885,"味多美(广安门店)","广内大街白广路306号","010-63589375",new Date()));
for(BcShop bc :list){
IndexResponse response=client.prepareIndex("test_sale","test_shop").setSource(JSON.toJSONString(bc)).get();
if (response.isCreated()) {
System.out.println("创建成功!");
}
}

批量操作


List<BcShop> list= shopService.getList(10,1000);
BulkRequestBuilder bulkRequestBuilder = client.prepareBulk().setRefresh(true);
for (BcShop shop :list){
bulkRequestBuilder.add(client.prepareIndex("test_sale","test_shop")
.setSource(JSON.toJSONString(shop)));
}
bulkRequestBuilder.execute().actionGet();

Query

  QueryBuilder builder = QueryBuilders.termQuery("shop_id", 1936212235);
SearchResponse response = client.prepareSearch("test_sale").setTypes("test_shop").setQuery(builder).get();
SearchHits hits = response.getHits();
if (hits.totalHits() > 0) {
for (SearchHit hit : hits) {
System.out.println("score:" + hit.getScore() + ":\t" + hit.getSource().get("shop_name"));
}
}

Elasticsearch入门(一)的更多相关文章

  1. ElasticSearch入门-搜索如此简单

    搜索引擎我也不是很熟悉,但是数据库还是比较了解.可以把搜索理解为数据库的like功能的替代品.因为like有以下几点不足: 第一.like的效率不行,在使用like时,一般都用不到索引,除非使用前缀匹 ...

  2. ElasticSearch入门知识扫盲

    ElasticSearch 入门介绍 tags: 第三方 lucene [toc] 1. what Elastic Search(ES)是什么 全文检索和lucene 全文检索 优点:高效,准确,分词 ...

  3. 《读书报告 -- Elasticsearch入门 》--简单使用(2)

    <读书报告 – Elasticsearch入门 > ' 第四章 分布式文件存储 这章的主要内容是理解数据如何在分布式系统中存储. 4.1 路由文档到分片 创建一个新文档时,它是如何确定应该 ...

  4. 《读书报告 -- Elasticsearch入门 》-- 安装以及简单使用(1)

    <读书报告 – Elasticsearch入门 > 第一章 Elasticsearch入门 Elasticsearch是一个实时的分布式搜索和分析引擎,使得人们可以在一定规模上和一定速度上 ...

  5. ElasticSearch入门 附.Net Core例子

    1.什么是ElasticSearch? Elasticsearch是基于Lucene的搜索引擎.它提供了一个分布式,支持多租户的全文搜索引擎,它具有HTTP Web界面和无模式JSON文档. Elas ...

  6. ElasticSearch入门点滴

    这是Elasticsearch-6.2.4 版本系列的第一篇: ElasticSearch入门 第一篇:Windows下安装ElasticSearch ElasticSearch入门 第二篇:集群配置 ...

  7. 全文搜索引擎Elasticsearch入门实践

    全文搜索引擎Elasticsearch入门实践 感谢阮一峰的网络日志全文搜索引擎 Elasticsearch 入门教程 安装 首先需要依赖Java环境.Elasticsearch官网https://w ...

  8. Elasticsearch Elasticsearch入门指导

    Elasticsearch入门指导 By:授客 QQ:1033553122 1. 开启elasticsearch服务器 1 2. 基本概念 2 <1> 集群(Cluster) 2 < ...

  9. ElasticSearch 入门

    http://www.oschina.net/translate/elasticsearch-getting-started?cmp ElasticSearch 简单入门 返回原文英文原文:Getti ...

  10. 全文搜索引擎 Elasticsearch 入门

    1. 百科 ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticsearch是用Java开发的,并作 ...

随机推荐

  1. 201709021工作日记--Volley源码详解(五)

    学习完了CacheDispatcher这个类,下面我们看下NetworkDispatcher这个类的具体细节,先上代码: /** * 提供一个线程执行网络调度的请求分发 * Provides a th ...

  2. 基于NLP和GAN的小说影视化

    轮廓: https://tieba.baidu.com/p/1271120336 着色:

  3. struts2从浅至深(六)总结

    在我认为strust2的作用就是 1.主要跟前端交互的框架数据提交先经过struts 2.起到对数据的过滤,接受数据 3.把数据显示到前段,具有很成熟的ognl技术,用起来特别方便 4.还提供了跟前段 ...

  4. google-glog功能介绍

    google-glog功能介绍 分类: 其它类型2011-08-19 10:06 6618人阅读 评论(0) 收藏 举报 cookiesgooglestreammodulemapreducenull ...

  5. Citrus Engine简单Demo

    Citrus Engine是一个的开源flash平台(platform,也可以说是卷轴类)游戏引擎,它基于Starling Framework添加了各种物理引擎,3D引擎,动画引擎. Citrus实现 ...

  6. springMVC ModelAndView 作用与功能解析 【转】

    Spring mvc视图机制 所有的web应用的mvc框架都有它定位视图的方式.Spring提供了视图解析器供你在浏览器中显示模型数据,而不必被拘束在特定的视图技术上. Spring的控制器Contr ...

  7. Python学习-33.Python中glob模块的一些参数

    glob模块中有一个叫glob的方法可以获取某个目录下的文件. import glob temp=glob.glob("E:\\Temp\\*.txt") print(temp) ...

  8. arduino远程刷新(烧录)固件

    在车间部署了十几个网络版的温湿度采集器(基于arduino的),这些采集器分布在不同的地方,现在要更新一下上面的固件.最笨的方法是一个一个地取下来,插到电脑的USB接口上进行固件更新,这样做显然很麻烦 ...

  9. android RadioButton文字居中的方法

    每个RadioButton的style原先是这样的: <style name="radiobutton_style" > <item name="and ...

  10. 基于RBAC设计的通用权限管理框架

    RoadFlow拥有基于RBAC设计的通用权限管理框架.不仅可以基于角色组进行菜单授权,还可以根据组织架构中部门.岗位.人员等进行细分的权限管理分配. 如果一个人有重复菜单权限,则将自动合并. 系统资 ...