Elasticsearch之pythonAPI简单使用

elasticsearch自动补全建议功能

数据入库操作

ESmapping要求

PUT music

{

    "mappings": {

        "_doc" : {

            "properties" : {

                "suggest" : {

                    "type" : "completion"

                },

                "title" : {

                    "type": "keyword"

                }

            }

        }

    }

}

DocType类

from elasticsearch_dsl import DocType, Date, Nested, Boolean, \

    analyzer, InnerObjectWrapper, Completion, Keyword, Text, Integer

from elasticsearch_dsl.analysis import CustomAnalyzer as _CustomAnalyzer

from elasticsearch_dsl.connections import connections

connections.create_connection(hosts=["localhost"])

class CustomAnalyzer(_CustomAnalyzer):

    """

        避免ik_analyzer参数传递时会报错的问题

    """

    def get_analysis_definition(self):

        return {}

ik_analyzer = CustomAnalyzer("ik_max_word", filter=["lowercase"])

class ArticleType(DocType):

    suggest = Completion(analyzer=ik_analyzer)

    ...

Items类

from models.es_types import ArticleType

from elasticsearch_dsl.connections import connections

es = connections.create_connection(ArticleType._doc_type.using)

def gen_suggests(index, info_tuple):

    # 根据字符串生成搜索建议数组

    used_words = set()

    suggests = []

    for text, weight in info_tuple:

        if text:

            # 调用es的analyze接口分析字符串

            words = es.indices.analyze(index=index, analyzer="ik_max_word", params={'filter':["lowercase"]}, body=text)

            anylyzed_words = set([r["token"] for r in words["tokens"] if len(r["token"])>1])

            new_words = anylyzed_words - used_words

        else:

            new_words = set()

        if new_words:

            suggests.append({"input":list(new_words), "weight":weight})

class JobBoleArticleItem(scrapy.Item):

    ...

    def save_to_es(self):

        ...

        article.suggest = gen_suggests(ArticleType._doc_type.index, ((article.title,10),(article.tags, 7)))

        article.save()

        redis_cli.incr("jobbole_count")

        return

ES搜索语法

POST myindex/_search?pretty

{

    "suggest": {

        "my-suggest": {

            "text": "linux",

            "completion": {

                "field": "suggest",

                "fuzzy": {

                    "fuzziness": 2

                }

            }

        }

    },

    "_source": ["title"]

}

自动补全建议核心代码

# django_views中的写法

from search.models import ArticleType

class SearchSuggest(View):

    def get(self, request):

        key_words = request.GET.get('s','')

        re_datas = []

        if key_words:

            s = ArticleType.search()

            s = s.suggest('my_suggest', key_words, completion={

                "field":"suggest", "fuzzy":{

                    "fuzziness":2

                },

                "size": 10

            })

            suggestions = s.execute_suggest()

            for match in suggestions.my_suggest[0].options:

                source = match._source

                re_datas.append(source["title"])

        return HttpResponse(json.dumps(re_datas), content_type="application/json")

elasticsearch内容搜索功能

数据入库操作

　　和上面一样

搜索核心代码

# django_views中的写法

from elasticsearch import Elasticsearch

client = Elasticsearch(hosts=["127.0.0.1"])

class SearchView(View):

    def get(self, request):

        key_words = request.GET.get("q","")

        s_type = request.GET.get("s_type", "article")

        page = request.GET.get("p", "")

        try:

            page = int(page)

        except:

            page = 1

        start_time = datetime.now()

        response = client.search(

            index= "jobbole",

            body={

                "query":{

                    "multi_match":{

                        "query":key_words,

                        "fields":["tags", "title", "content"]

                    }

                },

                "from":(page-1)*10,

                "size":10,

                "highlight": {

                    "pre_tags": ['<span class="keyWord">'],

                    "post_tags": ['</span>'],

                    "fields": {

                        "title": {},

                        "content": {},

                    }

                }

            }

        )

        end_time = datetime.now()

        last_seconds = (end_time-start_time).total_seconds()

        total_nums = response["hits"]["total"]

        if (page%10) > 0:

            page_nums = int(total_nums/10) +1

        else:

            page_nums = int(total_nums/10)

        hit_list = []

        for hit in response["hits"]["hits"]:

            hit_dict = {}

            if "title" in hit["highlight"]:

                hit_dict["title"] = "".join(hit["highlight"]["title"])

            else:

                hit_dict["title"] = hit["_source"]["title"]

            if "content" in hit["highlight"]:

                hit_dict["content"] = "".join(hit["highlight"]["content"])[:500]

            else:

                hit_dict["content"] = hit["_source"]["content"][:500]

            hit_dict["create_date"] = hit["_source"]["create_date"]

            hit_dict["url"] = hit["_source"]["url"]

            hit_dict["score"] = hit["_score"]

            hit_list.append(hit_dict)

        return render(request, "result.html", {"page":page,

                                            "all_hits":hit_list,

                                            "key_words":key_words,

                                            "total_nums":total_nums,

                                            "page_nums":page_nums,

                                            "last_seconds":last_seconds

                                            })

scrapy框架+django框架组合使用

github项目参考

https://github.com/holgerd77/django-dynamic-scraper

Elasticsearch之pythonAPI简单使用的更多相关文章

《读书报告 -- Elasticsearch入门》--简单使用（2）
<读书报告 – Elasticsearch入门 > ' 第四章分布式文件存储这章的主要内容是理解数据如何在分布式系统中存储. 4.1 路由文档到分片创建一个新文档时,它是如何确定应该 ...
ElasticSearch中的简单查询
前言最近修改项目,又看了下ElasticSearch中的搜索,所以简单整理一下其中的查询语句等.都是比较基础的.PS,好久没写博客了..大概就是因为懒吧.闲言少叙书归正传. 查询示例 http:// ...
ElasticSearch文档-简单介绍
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进行数据索引 ...
Elasticsearch就这么简单
一.前言最近有点想弄一个站内搜索的功能,之前学过了Lucene,后来又听过Solr这个名词.接着在了解全文搜索的时候就发现了Elasticsearch这个,他也是以Lucene为基础的. 我去搜了几 ...
ElasticSearch安装及简单配置说明
目录 1. 准备安装包... 1 2. 安装jdk7. 1 3. 安装ElasticSearch. 2 4. 安装maven. 3 5. 集成IK ...
Elasticsearch学习(一)————简单命令
Elasticsearch一.简介**Elasticsearch 是一个分布式的搜索和分析引擎,可以用于全文检索.结构化检索和分析,并能将这三者结合起来.Elasticsearch 基于 Lucene ...
elasticsearch搜索类型简单介绍
简单搜索 GET请求很easy--你能轻松获取你想要的文档.让我们来进一步尝试一些东西.比方简单的搜索! 我们尝试一个最简单的搜索所有员工的请求: GET /megacorp/employee/_se ...
在linux上安装elasticsearch简称ES 简单介绍安装步骤
1.简介 Elasticsearch 是一个分布式可扩展的实时搜索和分析引擎,一个建立在全文搜索引擎 Apache Lucene(TM) 基础上的搜索引擎.当然 Elasticsearch 并不仅仅是 ...
Java中使用elasticsearch搜索引擎实现简单查询、修改等操作-已在项目中实际应用
以下的操作环境为:jdk:1.8:elasticsearch:5.2.0 maven架包下载坐标为: <dependency> <groupId>org.elasticsear ...

随机推荐

ES6-总结
在最近进行的项目中,已经全面使用到ES6,这里对ES6进行整理总结.用得比较多的是带*的内容,这些语法.新增类型.模块调用等从代码量上.可读性上.操作上给项目带来了不少便利. 1.语法 1.1.命 ...
python标准模块
sys模块这是一个跟python解释器关系密切的标准库.它提供了一些和python解释器操作密切的属性和函数. sys中常用的函数和属性: sys.argv: sys.argv是专门用来向pytho ...
并查集：HDU5326-Work（并查集比较简单灵活的运用）
Work HDU原题地址:http://acm.hdu.edu.cn/showproblem.php?pid=5326 Time Limit: 2000/1000 MS (Java/Others) M ...
[BZOJ3625][CF438E]小朋友和二叉树
题面 Description 我们的小朋友很喜欢计算机科学,而且尤其喜欢二叉树. 考虑一个含有\(n\)个互异正整数的序列\(c_1,c_2,\ldots,c_n\).如果一棵带点权的有根二叉树满足其 ...
hibernate实体xml一对多关系映射
单向一对多关系映射: 一个房间对应多个使用者,也就是Room實例知道User實例的存在,而User實例則沒有意識到Room實例. 用户表: package onlyfun.caterpillar; p ...
React基础（Diff算法，属性和状态）
1.React的背景原理 (1)React Diff算法流程 (2)React虚拟DOM机制 React引入了虚拟DOM(Virtual DOM)的机制:在浏览器端用Javascript实现了一套DO ...
AD管理中心
(一).安装 Active Directory 管理中心引用位置: http://technet.microsoft.com/zh-cn/library/dd560652(WS.10).aspx ( ...
关于html头部引用（meta，link）
/*这一段头部表示如果安装了GCF,则使用GCF来渲染页面,如果为安装GCF,则使用最高版本的IE内核进行渲染.*/<meta content="IE=edge,chrome=1&q ...
lucene.NET详细使用与优化详解
lucene.NET详细使用与优化详解 http://www.cnblogs.com/qq4004229/archive/2010/05/21/1741025.html http://www.shan ...
Android TextWatcher的使用方法（监听ExitText的方法）
我做了一个查询单词的简单app, 当在EditText中输入单词的时候,点击lookup,则在TextView区域显示出该单词的意思,当EditText中没有任何字符时,显示"word de ...

Elasticsearch之pythonAPI简单使用

elasticsearch自动补全建议功能

elasticsearch内容搜索功能

scrapy框架+django框架组合使用

Elasticsearch之pythonAPI简单使用的更多相关文章

随机推荐

热门专题