Elaticsearch，简称为es，es是一个开源的高扩展的分布式全文检索引擎，它可以近乎实时的存储、检索数据;本身扩展性很好，可以扩展到上百台服务器，处理PB级别的数据。es也使用lava开发并使用Lucene作为其核心来实现所有索引和搜索的功能，但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性，从而让全文搜索变得简单。

据国际权威的数据库产品评测机构DB Engines的统计，在2016年1月，ElasticSearch已超过Solr等，成为排名第一的搜索引擎类应用。

它用于全文搜索、结构化搜索、分析以及将这三者混合使用

一、ES安装

提前说明:Elaticsearch基于java1.8以上使用我们需要安装客户端与界面工具 Elaticsearch的版本要与java的jar包依赖对应

解压即可使用

启动elasticsearch.bat 访问 127.0.0.1:9200

安装可视化插件

安装elasticsearch-head插件（需要Node.js环境）
解决跨域问题

http.cors.enabled: true

http.cors.allow-origin: "*"

另外，也可以之间安装对应的elasticsearch-head 谷歌插件不会有跨域问题

了解 ELK

Kibana

Kibana是一个针对Elasticsearch的开源分析及可视化平台，用来搜索、查看交互存储在Elasticsearch索引中的数据。使用Kibana ,可以通过各种图表进行高级数据分析及展示。Kibana让海量数据更容易理解。它操作简单，基于浏览器的用户界面可以快速创建仪表板( dashboard ) 实时显示Elasticsearch查询动态。设置Kibana非常简单。无需编码或者额外的基础架构，几分钟内就可以完成Kibana安装并启动Elasticsearch索引监测。

官网：Kibana：数据的探索、可视化和分析 | Elastic 下载的版本要一致、需要依赖Node环境

解压完成之后启动kibana.bat 访问 http://localhost:5601

网站默认是英文，更改配置文件

i18n.locale: "zh-CN"

二、相关概念

elasticsearch是面向文档

关系行数据库和elasticsearch客观的对比!

物理设计∶

elasticsearch在后台把每个索引划分成多个分片，每分分片可以在集群中的不同服务器间迁移

默认的集群名称就是elasticsearch

逻辑设计:

一个索引类型中，包含多个文档，比如说文档1，文档2。当我们索引一篇文档时，可以通过这样的一各顺序找到它:索引》类型文档ID，通过这个组合我们就能索引到某个具体的文档。注意:ID不必是整数，实际上它是个字符串。

文档

索引

就是数据库! 索引是映射类型的容器，elasticsearch中的索引是一个非常大的文档集合。索引存储了映射类型的字段和其他设置。然后它们被存储到了各个分片上了。

如何分片

倒排索引

三、IK分词器

什么是IK分词器？

分词:即把一段中文或者别的划分成一个个的关键字，我们在搜索时候会把自己的信息进行分词，会把数据库中或者索引库中的数据进行分词，然后进行一个匹配操作，默认的中文分词是将每个字看成一个词，不符合要求

IK提供了两个分词算法:ik_ smart和ik_max_word，其中ik smart为最少切分，ik_max_word为最细粒度划分!

下载地址：https://github.com/medcl/elasticsearch-analysis-ik/releases
下载完毕后放入elasticsearch插件中即可注意版本对应
启动elasticsearch
使用kibana测试

ik smart为最少切分：

ik_max_word为最细粒度划分：
有时候分词器不能得出我们想要的，所以需要配置字典

我们需要自己配置分词就在自己定义的dic文件中进行配置即可!

四、基本操作

Rest风格说明：一种软件架构风格，而不是标准，只是提供了一组设计原则和约束条件。它主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁，更有层次，更易于实现缓存等机制。

创建索引

创建一个索引

PUT /索引名/类型名（）可省略/文档id

{  请求体  }

2. 指定的类型

3. 指定字段的类型

# 创建规则

PUT /test2

{

  "mappings": {

    "properties": {

      "name": {

        "type": "text"

      },

      "age": {

        "type": "integer"

      }

    }

  }

}

查看信息

查看规则

GET test2

查看默认的信息

PUT /test3/_doc/1

{

  "name": "前度",

  "age": 10

}

GET test3

如果自己的文档字段没有指定，那么es就会给我们默认配置字段类型另外通过命令elasticsearch索引情况!通过 get _cat/ 可以获得es的当前的很多信息!

修改索引

方法1：提交还是使用PUT即可!然后覆盖!最新办法!

方法2：

POST /test1/type1/1/_update

{

  "doc":{

    "name": "张三"

  }

}

删除索引

通过DELETE命令实现删除、根据你的请求来判断是删除索引还是删除文档记录!

DELETE test2

简单搜索

GET test1/_search?q=name:前度

_search：代表搜素

?q=xxxx: 搜素条件

复杂搜索

我们之后使用Java操作es ，所有的方法和对象就是这里面的key !

情景2：限制显示的字段信息

情景3：排序

情景4：分页查询

情景5：多条件都满足查询

情景6：或（OR）查询

情景7：精确查询

情景8：高亮显示

我们也能自定义高亮显示样式

五、集成SpringBoot

导入依赖

         <dependency>

            <groupId>org.elasticsearch.client</groupId>

            <artifactId>transport</artifactId>

            <version>7.6.2</version>

        </dependency>

        <dependency>

            <groupId>org.elasticsearch.client</groupId>

            <artifactId>elasticsearch-rest-high-level-client</artifactId>

            <version>7.6.2</version>

        </dependency>

<!--集成SpringBoot只需导入下面这个-->

<!-- https://mvnrepository.com/artifact/org.springframework.boot/spring-boot-starter-data-elasticsearch -->

        <dependency>

            <groupId>org.springframework.boot</groupId>

            <artifactId>spring-boot-starter-data-elasticsearch</artifactId>

            <version>7.6.2</version>

        </dependency>

自定义版本：

2. 构建与关闭

3. 源码

4. 配置

@Configuration

public class ElasticSearchConfig {

    @Bean

    public RestHighLevelClient restHighLevelClient() {

        RestHighLevelClient client = new RestHighLevelClient(RestClient.builder(

                new HttpHost("127.0.0.1", 9200, "http")

        ));

        return client;

    }

}

索引API操作

创建索引

    @Autowired

    private RestHighLevelClient client;

    //索引的创建 Request

    @Test

    public void creatIndex() throws IOException {

        //1、创建索引请求

        CreateIndexRequest request = new CreateIndexRequest("qiandu_index");

        //2、执行请求->请求后获得响应

CreateIndexResponse response = client.indices().create(request, RequestOptions.DEFAULT);

        System.out.println(response);

    }

判断索引是否存在

    //获取索引

    public void existsIndex() throws IOException {

        GetIndexRequest request = new GetIndexRequest("qiandu_index");

        //判断索引是否存在

        boolean exists = client.indices().exists(request, RequestOptions.DEFAULT);

    }

删除索引

    //删除索引

    public void deleteIndex() throws IOException {

        DeleteIndexRequest request = new DeleteIndexRequest("qiandu_index");

        //判断索引是否存在

        AcknowledgedResponse delete = client.indices().delete(request, RequestOptions.DEFAULT);

        //返回true代表删除

        System.out.println(delete.isAcknowledged());

    }

文档API操作

首先需要创建实体类

添加文档

    //添加文档

    public void addDocument() throws IOException {

        // 创建对象

        User user = new User(1, "qiandu");

        //创建请求

        IndexRequest request = new IndexRequest("qinadu_index");

        //设置规则 PUT /qiandu_index/_doc/1

        request.id("1");

        request.timeout(TimeValue.timeValueSeconds(1));

        //将数据放入请求  JSON

        ObjectMapper objectMapper = new ObjectMapper();

        String s = objectMapper.writeValueAsString(user);

        request.source(s, XContentType.JSON);

        //发送请求,获取响应结果

        IndexResponse indexResponse = client.index(request, RequestOptions.DEFAULT);

        System.out.println(indexResponse.toString());

        //返回的状态：create/update

        System.out.println(indexResponse.status());

    }

获取文档，判断是否存在

    //获取文档，判断是否存在 GET qiandu_index/1

    public void existsDocument() throws IOException {

        GetRequest request = new GetRequest("qiandu_index", "1");

        //不获取返回的_source的上下文

        request.fetchSourceContext(FetchSourceContext.DO_NOT_FETCH_SOURCE);

        boolean exists = client.exists(request, RequestOptions.DEFAULT);

        System.out.println(exists);

    }

获取文档的信息

    //获取文档的信息

    public void getDocument() throws IOException {

        GetRequest request = new GetRequest("qiandu_index", "1");

        GetResponse response = client.get(request, RequestOptions.DEFAULT);

        //打印内容 或者用map

        System.out.println(response.getSourceAsString());

        //返回全部内容

        System.out.println(response);

    }

更新文档信息

    //更新文档信息

    public void updateDocument() throws IOException {

        UpdateRequest request = new UpdateRequest("qindau_index", "1");

        request.timeout("1s");

        User user = new User(2, "前度");

        ObjectMapper objectMapper = new ObjectMapper();

        String s = objectMapper.writeValueAsString(user);

        request.doc(s, XContentType.JSON);

        UpdateResponse response = client.update(request, RequestOptions.DEFAULT);

        System.out.println(response.status());

    }

删除文档

    //删除文档

    public void deleteDocument() throws IOException {

        DeleteRequest request = new DeleteRequest("qinadu_index", "2");

        DeleteResponse response = client.delete(request, RequestOptions.DEFAULT);

        System.out.println(response.status());

    }

批量插入数据

  //批量插入/删除/更新数据

    public void insert() throws IOException {

        BulkRequest bulkRequest = new BulkRequest();

        bulkRequest.timeout("10s");

        ArrayList<User> userList = new ArrayList<>();

        userList.add(new User(1, "前度1"));

        userList.add(new User(2, "前度2"));

        ObjectMapper objectMapper = new ObjectMapper();

        for (int i = 0; i < userList.size(); i++) {

            //批量更新/删除也是如此

            bulkRequest.add(

                    new IndexRequest("qiandu_index")

                            .id("" + (i + 1))

                            .source(objectMapper.writeValueAsString(userList.get(i)), XContentType.JSON)

            );

        }

        BulkResponse response = client.bulk(bulkRequest, RequestOptions.DEFAULT);

        //判断是否执行成功  返回false表示成功

        System.out.println(response.hasFailures());

    }

查询

    //查询

    public void query() throws IOException {

        SearchRequest request = new SearchRequest("qiandu_index");

        //构建搜索条件

        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();

        //设置高亮显示

        HighlightBuilder highlightBuilder = new HighlightBuilder();

        highlightBuilder.preTags("<p style=' color : red '");

        highlightBuilder.postTags("</p>");

        highlightBuilder.field("name");

        highlightBuilder.requireFieldMatch()

        TermQueryBuilder termQuery = QueryBuilders.termQuery("name", "前度");

        sourceBuilder.query(termQuery).highlighter(highlightBuilder);

        //设置超时

        sourceBuilder.timeout(new TimeValue(60, TimeUnit.SECONDS));

        request.source(sourceBuilder);

        //执行请求

        SearchResponse response = client.search(request, RequestOptions.DEFAULT);

        //返回的所有数据都在hits中

        System.out.println(response.getHits());

        //打印

        for (SearchHit document : response.getHits().getHits()) {

            //原结果

            System.out.println(document.getSourceAsMap());

            Map<String, HighlightField> highlightFields = document.getHighlightFields();

            //得到高亮的字段

            HighlightField field = highlightFields.get("name");

            //原来的结果

            Map<String, Object> sourceAsMap = document.getSourceAsMap();

            //解析高亮的字段，替换原来的字段

            if (field != null) {

                Text[] fragments = field.fragments();

                String n_field = "";

                for (Text text : fragments) {

                    n_field += text;

                }

                sourceAsMap.put("name", n_field);

            }

            //sourceAsMap放入list中

        }

    }

简单使用

1、

2、

The End~~

ElasticSearch搜索引擎的更多相关文章

elasticsearch搜索引擎环境的搭建
elasticsearch 搜索引擎解决了什么问题:在我们数据量很大时,我们使用模糊查询会使索引列的索引消失,这样使用elasticsearch来提高查询效率. 存在什么问题:有时我们查询的词,el ...
第三百七十一节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现我的搜索以及热门搜索
第三百七十一节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现我的搜索以及热门我的搜素简单实现原理我们可以用js来实现,首先用js获取到 ...
第三百七十节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索结果分页
第三百七十节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索结果分页逻辑处理函数计算搜索耗时在开始搜索前:start_time ...
第三百六十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能
第三百六十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能 Django实现搜索功能 1.在Django配置搜索结果页的路由映 ...
第三百六十八节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索的自动补全功能
第三百六十八节,Python分布式爬虫打造搜索引擎Scrapy精讲—用Django实现搜索的自动补全功能 elasticsearch(搜索引擎)提供了自动补全接口官方说明:https://www.e ...
第三百六十七节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)scrapy写入数据到elasticsearch中
第三百六十七节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)scrapy写入数据到elasticsearch中前面我们讲到的elasticsearch( ...
第三百六十六节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询
第三百六十六节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询 bool查询说明 filter:[],字段的过滤,不参与打分must:[] ...
第三百六十五节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本查询
第三百六十五节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本查询 1.elasticsearch(搜索引擎)的查询 elasticsearch是功能 ...
第三百六十四节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理
第三百六十四节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理 1.映射(mapping)介绍映射:创建索引的时候,可以预先定义字 ...
第三百六十三节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mget和bulk批量操作
第三百六十三节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mget和bulk批量操作注意:前面讲到的各种操作都是一次http请求操作一条数据,如果想 ...

随机推荐

java实用资料
1.怎么构造一个线程安全的hashmap?用reentrantreadwritelock2.线程是怎么处理二个以上的对象同时处理一个全局变量 3.读文件为啥不用字符流 4.请求鉴定,各种错误码502- ...
同步（synchronized）
转载至:https://www.cnblogs.com/dolphin0520/p/3923737.html 一.什么时候会出现线程安全问题? 在单线程中不会出现线程安全问题,而在多线程编程中,有可能 ...
java8 lambda表达式和函数式编程
什么是函数式接口(Functional Interface) 其实之前在讲Lambda表达式的时候提到过,所谓的函数式接口,当然首先是一个接口,然后就是在这个接口里面只能有一个抽象方法 (可以有def ...
JDBC中级篇（MYSQL）——处理大文本(CLOB)
注意:其中的JdbcUtil是我自定义的连接工具类:代码例子链接: package b_blob_clob; import java.io.FileNotFoundException; import ...
ES6——简单的多态
简单的多态多态: 1.同一个接口,在不同情况下做不一样的事情:相同的接口,不同的表现: 2.接口本身只是一组定义,实现都是子类里面:需要子类去实现的方法(子类只需重写与父类同名的方法,即可达到覆盖的 ...
redhat9 linux 网卡无法激活排障
先查看自己的系统版本! [root@localhost root]# uname -a Linux localhost 2.4.20-8 #1 Thu Mar 13 17:54:28 EST 2003 ...
python 实用技巧：几十行代码将照片转换成素描图、随后打包成可执行文件（源码分享）
效果展示原始效果图素描效果图相关依赖包 # 超美观的打印库 from pprint import pprint # 图像处理库 from PIL import Image # 科学计算库 imp ...
AndroidJetpack数据处理之数据库Room和懒加载Paging
数据库工具:Room Room结构导入依赖 app的build.gradle中开启kapt: apply plugin: 'kotlin-kapt' 并导入以下依赖: def room_versio ...
Java特性和优势
Java特性和优势简单性面向对象性可移植性高性能分布式动态性多线程安全性健壮性
【详细、开箱即用】.NET企业微信回调配置（数据回调URL和指令回调URL验证）
前言: 前段时间因为公司业务需求,需要将微信小程序与企业微信对接通,也就是把小程序绑定到对应的企业微信账号下,在该企业微信的用户可以将该小程序绑定到工作台中,然后可以在工作台中打开该小程序并授权.不过 ...

ElasticSearch搜索引擎