ES 使用小结

ES 是 Elastic Search 的缩写，可以理解为一个支持分布式部署的软件。

部署了以后可以当数据库用，虽然官方不建议这样做，但我们是这样干的。

它解决了很多场景下的查询需求，发版速度飞快，用的人蛮多的，使用 Java 开发并开源。

我刚接触没几天遇到了很多坑，在这里记录一下。

　　1、如何精确查询中文字段？

使用 keyword 特性，让分析器不进行拆词，然后使用 term query。如：

 [Keyword(Name = nameof(CompanyName), Index = true)]

 public string CompanyName { get; set; }

        /// <summary>

        /// Term Query 根据公司名称查询

        /// </summary>

        /// <param name="name"></param>

        /// <returns></returns>

        public IEnumerable<EnterpriseCreditInfo> SearchByName(string name)

        {

            var searchedList = this.client

                .Search<EnterpriseCreditInfo>(

                    m => m.Index(index).Query(q =>

                    //q.MatchPhrase(mc => mc.Field(ff => ff.CompanyName).Query(name))

                    q.Term(t => t.Field(f => f.CompanyName).Value(name))

                    ));

            return searchedList.Hits.Select(m =>

            {

                m.Source.Id = m.Id;

                return m.Source;

            });

        }

　　2、为什么使用 text 特性标记后使用 term query 查询中文查不到数据？如：

[Text(Name = nameof(CompanyName), Index = true)]

public string CompanyName { get; set; }

Text 特性和 Keyword 特性都是表示 string 类型的。

　　其中 Keyword 特性表示将索引 field 的值。

　　Text 表示使用分析器进行拆词索引多个 term 。

所以 Text 可以指定分词器而 Keyword 则不行。如指定 ik 中文分词器：

 [Text(Name = nameof(CompanyName), Index = true, Analyzer = "ik")]

  public string CompanyName { get; set; }

至于为什么无法命中索引，是因为默认的 Analyzer = "standard" 分词器会将中文分成一个汉字一个 term 所以直接查询 term 是查询不到的。

　　3、如何分词查询中文（全文搜索）？可以使用 match 系列。自己百度去。

　　4、使用 Nest 创建索引的方法有哪些？

        /// <summary>

        /// 默认的初始化 client

        /// </summary>

        /// <param name="nodes">服务器集群</param>

        /// <param name="index">索引名</param>

        protected virtual void InitClient(IEnumerable<Uri> nodes, string index)

        {

            var pool = new StaticConnectionPool(nodes);

            var settings = new ConnectionSettings(pool);

            settings.DefaultIndex(index);

            settings.DisableDirectStreaming(true);//影响性能发布时注释，用于抓取 request 和 response。

            client = new ElasticClient(settings.ThrowExceptions()); //直接抛出异常，发布时去掉。

            var exits = client.IndexExists(index);

            if (!exits.Exists)

            {

                CreateIndex(index + "_real", index);//默认使用别名，方便索引重建。

            }

        }

        /// <summary>

        /// 当索引不存在的时候创建索引。

        /// 根据 <see cref="Nest.ElasticsearchTypeAttribute"/> 自动映射类型

        /// 默认创建 NumberOfShards = 5

        /// 默认创建 NumberOfReplicas = 1,

        /// </summary>

        /// <param name="index"></param>

        protected virtual void CreateIndex(string index, string Alias)

        {

            var descriptor = new CreateIndexDescriptor(index)

                .Settings(s =>

                s.NumberOfShards().NumberOfReplicas())

                .Aliases(m => m.Alias(Alias))

                .Mappings(ms => ms.Map<T>(m => m

                .Properties(ps => ps

                   .Text(t => t.Name(n => n.Id))

                   .Text(t => t.Name(n => n.CreateTime).Index(true)))

                .AutoMap()));

            client.CreateIndex(descriptor);

        }

5、如何使用类似于 sql-in 的查询操作？

　　使用操作符| 、& 等拼接 term query ，可以实现各种查询，如 term any （网上抄的）：

        /// <summary>

        /// term any item of <paramref name="values"/>

        /// </summary>

        /// <typeparam name="T"></typeparam>

        /// <param name="descriptor"></param>

        /// <param name="field"></param>

        /// <param name="values"></param>

        /// <returns></returns>

        protected static QueryContainer TermAny(QueryContainerDescriptor<T> descriptor, Field field, IEnumerable<string> values)

        {

            QueryContainer q = new QueryContainer();

            foreach (var value in values)

            {

                q |= descriptor.Term(t => t.Field(field).Value(value));

            }

            return q;

        }

6、其他注意事项：

1、小写，index 和 type 要小写，否则抛异常。

term 是小写的。所以比如 term query

descriptor.Term(t => t.Field(field).Value("Foo")); 辣鸡 查不出来。用 keyword 不知道区不区分，一会试试再补。

帮到你的话点赞。

ES 使用小结的更多相关文章

ES使用小结之索引Rollover
Elasticsearch 使用小结之索引Rollover 索引名一般而言,客户端将数据每天写入一个索引,比如直接写入YYYY-MM-HH格式的索引,那么我们只需要在写入的客户端里面获取时间,然后得 ...
Elasticsearch全文检索实战小结
一.项目概述这是一个被我称之为“没有枪.没有炮,硬着头皮自己造”的项目.项目是和其它公司合作的三个核心模块开发. 使用ES的目的是: 1).采集数据.网站数据清洗后存入ES: 2).对外提供精确检索 ...
gitbook 入门教程之使用 gitbook-cli 开发电子书
gitbook 生成电子书主要有三种方式: gitbook-cli 命令行操作,简洁高效,适合从事软件开发的相关人员. gitbook-editor 编辑器操作,可视化编辑,适合无编程经验的文学创作者 ...
《死磕 Elasticsearch 方法论》：普通程序员高效精进的 10 大狠招！（完整版）
原文:<死磕 Elasticsearch 方法论>:普通程序员高效精进的 10 大狠招!(完整版) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链 ...
有关于OpenGL、OpenGL ES、WebGL的小结
转自原文有关于OpenGL.OpenGL ES.WebGL的小结一. OpenGL简介 OpenGL(全写Open Graphics Library)是个定义了一个跨编程语言.跨平台的编程接口 ...
Linux环境下段错误的产生原因及调试方法小结（转）
最近在Linux环境下做C语言项目,由于是在一个原有项目基础之上进行二次开发,而且项目工程庞大复杂,出现了不少问题,其中遇到最多.花费时间最长的问题就是著名的“段错误”(Segmentation F ...
Linux环境下段错误的产生原因及调试方法小结
转载自http://www.cnblogs.com/panfeng412/archive/2011/11/06/2237857.html 最近在Linux环境下做C语言项目,由于是在一个原有项目基础之 ...
Unity3d 经验小结
Unity3d 经验小结文本教程你是第2541个围观者 0条评论供稿者:Jamesgary 标签:unity3d教程 Fbx.贴图导入Unity时的注意事项: 在导出Fbx之前,Maya中已 ...
simple_html_dom使用小结
simple_html_dom使用小结分类: PHP2012-08-31 14:24 3094人阅读评论(0) 收藏举报 htmlcallbackstringdivfunctionfile 1 ...

随机推荐

Spring Framework简介
作者关于此主题早期文章 Spring框架快速入门起源要谈Spring的历史,就要先谈J2EE.J2EE应用程序的广泛实现是在1999年和2000年开始的,它的出现带来了诸如事务管理之类的核心中间层 ...
elasticsearch数据过期删除处理
一.概述使用elasticsearch收集日志进行处理,时间久了,很老的数据就没用了或者用途不是很大,这个时候就要对过期数据进行清理.这里介绍两种方式清理这种过期的数据. 1.curator 关于版 ...
Rails/ActiveRecord order by Array
ActiveRecord中如果想根据自定义的一个数组id集合排序: ids = [2,1,3] users = User.where("id in (?)",ids) result ...
从前端角度看ajax如何保护接口的安全性
一.前言在web中,使用Ajax调用API,撇开跨域不讲,怎么做安全验证,防止别的网站调用呢?假设没有做安全保障,任何用户都可以直接访问接口,这回暴露出极大的安全隐患. 二.后端怎么做? 1.一些接 ...
c# 对html字符串进行编码
/// <summary> /// 对html字符串进行编码 /// </summary> /// <param name="html">htm ...
C# 语句分支语句 switch----case----.
第二种分支语句 switch..case. switch(一个变量){ case 值:要执行的代码段;break; case 值:要执行的代码段;break; ... ... ... default ...
本地计算机上的MySQL服务启动后停止。某些服务在未由其他服务或程序使用时将自动
重新安装MySQL数据库,由于安装的时候马虎,一路next(事实上,某些地方需要严格的配置,我忘记注意了),导致现在出了很多麻烦. 错误信息: 本地计算机上的MySQL服务启动后停止.某些服务在未由其 ...
The Maze Makers（csu1566）
1566: The Maze Makers Time Limit: 1 Sec Memory Limit: 128 MBSubmit: 90 Solved: 33[Submit][Status][ ...
Linux常用基本命令：三剑客命令之-awk内置函数用法
awk的内置函数大致可以分类为算数函数.字符串函数.时间函数.其他函数等算数函数最常用的算数函数有rand函数.srand函数.int函数. 可以使用rand函数生成随机数,但是使用rand函数时 ...
Flask 中的 CBV 与上传文件
from flask import Flask, views, render_template, request app = Flask(__name__) app.config['DEBUG'] = ...

ES 使用小结

ES 使用小结的更多相关文章

随机推荐

热门专题