全文搜索

我们通过前文的简单样例,已经了解了结构化数据的条件搜索;如今。让我们来了解全文搜索-- 如何通过匹配全部域的文本找到最相关的文章。

关于全文搜索有两个最重要的方面:
相似度计算
通过TF/IDF (see 

p=43#relevance-intro" style="border:0px; font-family:inherit; font-style:inherit; margin:0px; outline:0px; padding:0px; vertical-align:baseline; color:rgb(85,85,85); text-decoration:none">[relevance-intro]),地理位置接近算法。模糊相似度算法或者其它算法,用来给给定查询条件的结果排序。

文本分析
通过把文本分割和归一化后的词元。去(a)生成倒排索引,或者去(b)查询倒排索引。
当我们在讨论相似度计算和文本分析的时候,我们仅仅是在讨论查询。而不是过滤

词条搜索 vs. 全文搜索

即使全部的查询都要运行一些相似度排序,可是不是全部的查询条件都须要文本分析。 由于有些特殊的查询就不是在文本上运行的,列如boolfunction_score
它们是boolean查询和数值查询。文本查询能够分为两个种类:
词条查询
低级别的termfuzzy查询没有文本分析,它们仅仅是在单个词条上查询。

列如词条"Foo"term查询,
是在倒排索引种查找全然匹配的词条,然后给每一篇包括这个词条的文章做TF/IDF相似度打分。

记住:词条"Foo"term查询仅仅是在倒排索引里查找全然匹配的词条,它不会匹配到"foo"或者"FOO"
当你在not_analyzed的域用["Foo","Bar"]生成索引。或者在用whitespace分析器的域用"Foo
Bar"
生成索引。 它们都会在倒排索引里生成两个词元"Foo""Bar"

全文查询
高级别的matchquery_string查询可以理解这些域的映射:
* 假设在dateinteger属性的域,查询文本会被当日期或者整数来对待。

* 假设在(not_analyzed)属性的文本域,查询文本会被当做一个词条来查询。 * 可是,假设在(analyzed)属性的文本域,查询文本会用恰当得分析器去产生词条。而这些词条都会被用来查询。

一旦查询得到这些词条。它就用适当的低级查询去运行每个词条,然后用查询结果计算每一篇文章的相似度打分。

我们将在后面的章节中具体介绍这个过程。

通常。你差点儿都不会直接用到基于词元的查询,很多其它的,你会用更方便的高级全文查询(事实上内部是用基于词元的查询)
当你想在not_analyzed域查询全然匹配值的时候,你应该考虑一下你究竟是用查询还是过滤。 由于单词条查询通常被表示为二元值yes|no,所以过滤能更好的表达它们。你能从这里收益的 filter
caching
:
GET /_search
{
"query": {
"filtered": {
"filter": {
"term": { "gender": "female" }
}
}
}
}


博客已搬家

原文链接:

p=43">http://www.callmer.com/?p=43

全文搜索-介绍-elasticsearch-definitive-guide翻译的更多相关文章

  1. 全文搜索之 Elasticsearch

    概述 Elasticsearch (ES)是一个基于 Lucene 的开源搜索引擎,它不但稳定.可靠.快速,而且也具有良好的水平扩展能力,是专门为分布式环境设计的. 特性 安装方便:没有其他依赖,下载 ...

  2. 可以执行全文搜索的原因 Elasticsearch full-text search Kibana RESTful API with JSON over HTTP elasticsearch_action es 模糊查询

    https://www.elastic.co/guide/en/elasticsearch/guide/current/getting-started.html Elasticsearch is a ...

  3. 在 Laravel 项目中使用 Elasticsearch 做引擎,scout 全文搜索(小白出品, 绝对白话)

    项目中需要搜索, 所以从零开始学习大家都在用的搜索神器 elasiticsearch. 刚开始 google 的时候, 搜到好多经验贴和视频(中文的, 英文的), 但是由于是第一次接触, 一点概念都没 ...

  4. 【SpringBoot】搜索框架ElasticSearch介绍和整合SpringBoot

    ========================12章 搜索框架ElasticSearch介绍和整合SpringBoot ============================= 加入小D课堂技术交 ...

  5. ElasticSearch搜索介绍四

    ElasticSearch搜索 最基础的搜索: curl -XGET http://localhost:9200/_search 返回的结果为: { "took": 2, &quo ...

  6. 12章 搜索框架ElasticSearch介绍和整合SpringBoot 4节课

    1.搜索引擎知识和搜索框架elasticsearch基本介绍     简介:通过京东电商 介绍什么是搜索引擎,和开源搜索框架ElasticSearch6.x新特性介绍 前言:介绍ES的主要特点和使用场 ...

  7. ElasticSearch 2 (14) - 深入搜索系列之全文搜索

    ElasticSearch 2 (14) - 深入搜索系列之全文搜索 摘要 在看过结构化搜索之后,我们看看怎样在全文字段中查找相关度最高的文档. 全文搜索两个最重要的方面是: 相关(relevance ...

  8. Elasticsearch系列---深入全文搜索

    概要 本篇介绍怎样在全文字段中搜索到最相关的文档,包含手动控制搜索的精准度,搜索条件权重控制. 手动控制搜索的精准度 搜索的两个重要维度:相关性(Relevance)和分析(Analysis). 相关 ...

  9. Elasticsearch全文搜索——adout

    现在尝试下稍微高级点儿的全文搜索——一项传统数据库确实很难搞定的任务. 搜索下所有喜欢攀岩(rock climbing)的雇员: curl -XGET 'localhost:9200/megacorp ...

随机推荐

  1. 转载-- C/S 与 B/S 区别

    C/S 与 B/S 区别   C/S结构,即Client/Server(客户机/服务器)结构,是大家熟知的软件系统体系结构,通过将任务合理分配到Client端和Server端,降低了系统的通讯开销,可 ...

  2. requestAnimationFrame 兼容处理

    (function() { ; var vendors = ['ms', 'moz', 'webkit', 'o']; ; x < vendors.length && !wind ...

  3. jQuery自定义组件——输入框设置默认提示文字

    if (window.jQuery || window.Zepto) { /** * 设置输入框提示信息 * @param options * @author rubekid */ var setIn ...

  4. 修改SELinux设置,使vsftp在enforcing security enhance模式下正常运行

    开了SELinux和防火墙,没想到引出了vsftp的问题.FTP登录报错:500 OOPS: cannot change directory.下面来看看产生这个问题的原因和对策. 首先,分析一下冲突原 ...

  5. myeclipse插件安装

    MyEclipse插件安装 安装1: HELP->MuEclipse Configuration Center.切换到SoftWare选项卡. 点击 add site 打开对话框,在对话框中na ...

  6. C++ template随笔

    话题从重用开始说起: 最基本的重用,重用一个方法,被重用的逻辑被抽取封装成为方法,之后我们把方法当成一种工具来使用(处理数据,输入输出,或者改变状态). 来到了面向对象的时代,如果这个方法出现父类上面 ...

  7. QT学习篇: 入门(二)

    库存订单界面: (1)包括序号.订单代码.订单名称.产品代码.产品类型.计划加工数量.最晚完工日期. (2)model增加临时map,用于存储库存订单. (3)后台计算完成后,会将库存订单推送给前台, ...

  8. 3.2 GUN as汇编(本文内容大部分引用原文,非原创)

    as86汇编仅仅用于编译内核中的boot/bootsect.s引导扇区程序和实模式下的设置程序boot/setup.s.内核中其余所有汇编语言程序(包括C语言产生的汇编程序)均使用gas来编译,并与C ...

  9. linux 添加 $path

    # vim /etc/profile在文档最后,添加:export PATH="/usr/local/src/bin:$PATH"保存,退出,然后运行:#source /etc/p ...

  10. 对比iOS网络组件:AFNetworking VS ASIHTTPRequest

    对比iOS网络组件:AFNetworking VS ASIHTTPRequest 作者 高嘉峻 发布于 2013年2月28日 | 7 讨论 分享到:微博微信FacebookTwitter有道云笔记邮件 ...