es分词器
1、默认的分词器
standard
standard tokenizer:以单词边界进行切分
standard token filter:什么都不做
lowercase token filter:将所有字母转换为小写
stop token filer(默认被禁用):移除停用词,比如a the it等等
2、修改分词器的设置
启用english停用词token filter
PUT /my_index
{
    "settings": {
        "analysis": {
            "analyzer": {
                "es_std": {
                    "type": "standard",
                    "stopwords": "_english_"
                }
            }
        }
    }
}
GET /my_index/_analyze
{
    "analyzer": "standard", 
    "text": "a dog is in the house"
}
GET /my_index/_analyze
{
    "analyzer": "es_std",
    "text":"a dog is in the house"
}
3、定制化自己的分词器
PUT /my_index
{
    "settings": {
        "analysis": {
            "char_filter": {
                "&_to_and": {
                    "type": "mapping",
                    "mappings": ["&=> and"]
                }
            },
            "filter": {
                "my_stopwords": {
                      "type": "stop",
                      "stopwords": ["the", "a"]
                }
            },
            "analyzer": {
                "my_analyzer": {
                    "type": "custom",
                    "char_filter": ["html_strip", "&_to_and"],
                    "tokenizer": "standard",
                    "filter": ["lowercase", "my_stopwords"]
                }
            }
        }
    }
}
GET /my_index/_analyze
{
    "text": "tom&jerry are a friend in the house, <a>, HAHA!!",
    "analyzer": "my_analyzer"
}
PUT /my_index/_mapping/my_type
{
    "properties": {
        "content": {
            "type": "text",
            "analyzer": "my_analyzer"
        }
    }
}
es分词器的更多相关文章
- es 分词器介绍
		按照单词切分,不做处理 GET _analyze { "analyzer": "standard", "text": "2 run ... 
- ElasticSearch 分词器,了解一下
		这篇文章主要来介绍下什么是 Analysis ,什么是分词器,以及 ElasticSearch 自带的分词器是怎么工作的,最后会介绍下中文分词是怎么做的. 首先来说下什么是 Analysis: 什么是 ... 
- Elasticsearch简介、倒排索引、文档基本操作、分词器
		lucene.Solr.Elasticsearch 1.倒排序索引 2.Lucene是类库 3.solr基于lucene 4.ES基于lucene 一.Elasticsearch 核心术语 特点: 1 ... 
- ES 09 - 定制Elasticsearch的分词器 (自定义分词策略)
		目录 1 索引的分析 1.1 分析器的组成 1.2 倒排索引的核心原理-normalization 2 ES的默认分词器 3 修改分词器 4 定制分词器 4.1 向索引中添加自定义的分词器 4.2 测 ... 
- ES系列一、CentOS7安装ES 6.3.1、集成IK分词器
		Elasticsearch 6.3.1 地址: wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.3. ... 
- 安装ik分词器以及版本和ES版本的兼容性
		一.查看自己ES的版本号与之对应的IK分词器版本 https://github.com/medcl/elasticsearch-analysis-ik/blob/master/README.md 二. ... 
- es的分词器analyzer
		analyzer 分词器使用的两个情形: 1,Index time analysis. 创建或者更新文档时,会对文档进行分词2,Search time analysis. 查询时,对查询语句 ... 
- es 修改拼音分词器源码实现汉字/拼音/简拼混合搜索时同音字不匹配
		[版权声明]:本文章由danvid发布于http://danvid.cnblogs.com/,如需转载或部分使用请注明出处 在业务中经常会用到拼音匹配查询,大家都会用到拼音分词器,但是拼音分词器匹配的 ... 
- es 5.0 拼音分词器 mac
		安装方法和ik中文分词器一样, 先下载: https://github.com/medcl/elasticsearch-analysis-pinyin 执行: mvn package; 打包成功以后, ... 
随机推荐
- Android qualcomm WCNSS_qcom_cfg.ini 参数介绍
			本文介绍WCNSS_qcom_cfg.ini中常用参数的作用. wifi 日志等级 vosTraceEnableBAP=255 vosTraceEnableTL=255 vosTraceEnableW ... 
- 利用反射将Model转化为sql
			public string GetInsertSqlByModel(Object o) { StringBuilder sbStart = new StringBuilder(); StringBui ... 
- Window应急响应(二):蠕虫病毒
			0x00 前言  蠕虫病毒是一种十分古老的计算机病毒,它是一种自包含的程序(或是一套程序),通常通过网络途径传播,每入侵到一台新的计算机,它就在这台计算机上复制自己,并自动执行它自身的程序. 常见的 ... 
- 【代码审计】五指CMS_v4.1.0 copyfrom.php 页面存在SQL注入漏洞分析
			0x00 环境准备 五指CMS官网:https://www.wuzhicms.com/ 网站源码版本:五指CMS v4.1.0 UTF-8 开源版 程序源码下载:https://www.wuzhi ... 
- Android编译环境——ubuntu12.04上android2.3.4编译错误以及解决
			Android编译环境——ubuntu12.04上android2.3.4编译错误以及解决 分类: android应用开发2013-08-21 09:20 4222人阅读 评论(3) 收藏 举报 li ... 
- Ubuntu下SSH无密码验证配置
			前言 SSH为Secure Shell 的缩写,是目前较可靠,专为远程登录会话和其他网络服务提供安全性的协议.越来越多的小伙伴们使用远程登录,而ssh安全性无疑是很高的,那么我们现在来看看如何实现ss ... 
- springboot集成rabbitmq的一些坑
			一.默认管理页面地址是 http://127.0.0.1:15672 但是spring配置连接里面要把端口改成5672,如果不配置的话默认就是端口5672 spring.rabbitmq.host=1 ... 
- Solve Error : Undefined function or variable ‘setInitialWorkingFolder’. Error in matlabrc (line 197)
			When compile program using Visual Studio 2015, Matlab 2016b, and OpenCV 3.1.0, one might get the err ... 
- db2pd工具
			内容 概览 简介 使用 db2pd 工具 监控的例子 db2pd 工具 用于监控 DB2 实例和数据库的新的 DB2 UDB 工具 简介 DB2 UDB V8.2 带来了一种新工具称为 db2pd,用 ... 
- imu内参标定
			https://medium.com/@tomas789/iphone-calibration-camera-imu-and-kalibr-33b8645fb0aa how kalibr model ... 
