在ES存储的文档,进行存储时,会对文档的内容进行分析和分词 分析的过程: 首先,将一块文本分成适合于倒排索引的独立的 词条 , 之后,将这些词条统一化为标准格式以提高它们的“可搜索性”,或者 recall 分析器的三个功能 1.字符过滤器 首先,字符串按顺序通过每个 字符过滤器 .他们的任务是在分词前整理字符串.一个字符过滤器可以用来去掉HTML,或者将 & 转化成 `and`. 2.分词器 其次,字符串被 分词器 分为单个的词条.一个简单的分词器遇到空格和标点的时候,可能会将文本拆分成词条.…