django2.1实现全文检索（最详细）+遇到的坑+jieba分词

首先django实现全文检索在这里使用的是haystack，环境是django2.1+win10 64+py3.7

1: 安装包：

pip install dgango-haystack   #安装全局检索框架

pip install jieba

pip install whoosh

#没有指明版本号的默认安装最新版

2: 在项目的根目录下的setting.py中配置haystack

首先在安装的app中添加haystack

在setting.py文件的最后进行haystack的配置，配置如下：

# 全文检索

HAYSTACK_CONNECTIONS = {

    'default': {

                    #你的应用名+whoosh_backend.Whooshengine, whoosh_backend后边我们会说到

        'ENGINE': 'df_goods.whoosh_backend.WhooshEngine',

        # 使用whoosh引擎

        # 索引文件路径

        'PATH': os.path.join(BASE_DIR,'whoosh_index'),

    }

}

# 指定每页显示的结果数量

HAYSTACK_SEARCH_RESULTS_PER_PAGE = 10

HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'  # 索引自动更新

# HAYSTACK_DEFAULT_OPERATOR = 'OR'

# 当修改，添加，删除数据时，索引会自动更新

3：我们搜索应用是df_goods,所以在df_goods路径下，需要创建两个haystack需要文件，search_indexes.py 和whoosh_cn_backend.py(这两个文件名不能变！！不能变！）

#df_goods_indexes.py:

from .models import GoodsInfo

from haystack import  indexes

class GoodsInfoIndex(indexes.SearchIndex,indexes.Indexable):

    text = indexes.CharField(document=True,use_template=True)#有且只能有一个document=True

    #对标题，简介，内容进行搜索

    gtitle= indexes.CharField(model_attr='gtitle')

    gjianjie = indexes.CharField(model_attr='gjianjie')

    gcontent = indexes.CharField(model_attr='gcontent')

    def get_model(self):

        return  GoodsInfo

    def index_queryset(self, using=None):

        return self.get_model().objects.all()

    #每个索引里面必须有且只能有一个字段document=True

4：在templates目录下新建search文件夹，在search文件夹下新建indexes目录，早indexes目录下新建你的应用名（这里是df_goods）,在应用名目录下新建对应models.py中的类名（这里是goodsinfo）_text.txt,这里是goodsinfo_text.txt,

在txt文件中添加如下代码：

{{object.gtitle}}

{{object.gjianjie}}

{{object.gcontent}}

‘’‘

格式是：{{object.你模型类中对应类中的属性}} #这里的是df_goods应用下的models中的goodsinfo类下的属性

’‘’

这个文件吧gtitle,gjinajie,gcontent指定为索引字段。

5：whoosh_backend.py文件在你的python安装目录下的libs下的site-packages下去找：比如我的是：D:\Python\install\Lib\site-packages\haystack\backends，

直接把它复制到你app（在这是df_goods）的目录下，之后我们对whoosh_backend.py进行修改，大概在165行附近；

from jieba.analyse import ChineseAnalyzer

#修改前：

schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer(), field_boost=field_class.boost, sortable=True)



#修改后

 schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=ChineseAnalyzer(), field_boost=field_class.boost, sortable=True)

6：在项目的url中配置haystack,也就是项目最开始的那个url，配置如下：

#记得一定要注意django中的path与re_path

re_path(r'^search/',include('haystack.urls')),

7: 之后我们在新建的templates下的search文件夹下新建search.html, 名字最好不要变！！



<!DOCTYPE html>

<html>

<head>

    <title></title>

</head>

<body>

{% if query %}

    <h3>搜索结果如下：</h3>

    {% for result in page.object_list %}

        <a href="/{{ result.object.id }}/">{{ result.object.gName }}</a><br/>

    {% empty %}

        <p>啥也没找到</p>

    {% endfor %}

    {% if page.has_previous or page.has_next %}

        <div>

            {% if page.has_previous %}<a href="?q={{ query }}&page={{ page.previous_page_number }}">{% endif %}« 上一页{% if page.has_previous %}</a>{% endif %}

        |

            {% if page.has_next %}<a href="?q={{ query }}&page={{ page.next_page_number }}">{% endif %}下一页 »{% if page.has_next %}</a>{% endif %}

        </div>

    {% endif %}

{% endif %}

</body>

</html>

8：生成索引：

python manage.py rebuild_index或者   python manage.py  update_index

9: 运行服务器 127.0.0.1/search就可以全文检索了！

django2.1实现全文检索（最详细）+遇到的坑+jieba分词的更多相关文章

稍微记录下Django2.2使用MariaDB和MySQL遇到的坑
现在演示一下整个流程吧 1.创建项目和应用 PS:你也可以使用PyCharm直接创建项目 2.注册应用先把刚刚创建的应用添加进去 3.配置MySQL或者MariaDB 4.PyMySQL替换默认的M ...
超详细：Python(wordcloud+jieba)生成中文词云图
# coding: utf-8 import jieba from scipy.misc import imread # 这是一个处理图像的函数 from wordcloud import WordC ...
使用IDEA工具配置和运行vue项目（详细其中的坑）
刚来公司实习发现公司的前端使用的是vue,之前根本就没有听说过.然后一上来就需要看代码,but but 就是没有文档什么的东西, 就需要自己去研读,我就想去运行其中的前端和后端联调起来方便理解,结果在 ...
Django中使用haystack进行全文检索时需要注意的坑
对于haystack的配置什么的我在这里就不必说什么了,毕竟一搜一大把. 直接说重点 1 当你通过继承haystack的views来自定义django 应用的views 时,你要注意heystack ...
（转）全文检索技术学习(三)——Lucene支持中文分词
http://blog.csdn.net/yerenyuan_pku/article/details/72591778 分析器(Analyzer)的执行过程如下图是语汇单元的生成过程: 从一个Re ...
django-haystack全文检索详细教程
前几天要用Django-haystack来实现搜索功能,网上一搜中文资源少之又少,虽说有官方文档,但相信对于我们这些英语差的同学来说要看懂真的是一件难事.特别是关于高级部分,特地找了个英语专业的来翻译 ...
Django：haystack全文检索详细教程
参考:https://blog.csdn.net/AC_hell/article/details/52875927 一.安装第三方库及配置 1.1 安装插件 pip install whoosh dj ...
PostgreSQL全文检索zhparser使用
本文引用自: http://blog.chinaunix.net/uid-20726500-id-4820580.html 防止文章丢失才进行复制 PostgreSQL支持全文检索,其内置的缺省的分词 ...
使用Lucene.Net实现全文检索
使用Lucene.Net实现全文检索目录一 Lucene.Net概述二分词三索引四搜索五实践中的问题一 Lucene.Net概述 Lucene.Net是一个C#开发的开源全文索引 ...

随机推荐

Java持久层框架Mybatis入门
MyBatis是什么 MyBatis是Java的持久层框架,GitHub的star数高达15.8k,是Java技术栈中最热门的ORM框架之一.它支持自定义SQL.存储过程以及高级映射,可以通过XML或 ...
Ajax(内含json)认识
Ajax 认识一.概念 1.Ajax 即"Asynchronous Javascript And XML"(英[eɪˈsɪŋkrənəs]异步 JavaScript 和 XML) ...
「模拟8.13」任(liu_runda的神题，性质分析)
考场时没有发现性质,用了个前缀和优化暴力,结果写WA了我们发现其实联通块的个数就是点的个数-边的个数然后我们需要维护横向上和纵向上的边的前缀和前缀和的查询形式稍改一下暴力 1 #include ...
noip2006总结
T1 能量项链原题在Mars星球上,每个Mars人都随身佩带着一串能量项链.在项链上有N颗能量珠.能量珠是一颗有头标记与尾标记的珠子,这些标记对应着某个正整数.并且,对于相邻的两颗珠子,前一颗珠子 ...
中文NER的那些事儿3. SoftLexicon等词汇增强详解&代码实现
前两章我们分别介绍了NER的基线模型Bert-Bilstm-crf, 以及多任务和对抗学习在解决词边界和跨领域迁移的解决方案.这一章我们就词汇增强这个中文NER的核心问题之一来看看都有哪些解决方案.以 ...
DDoS防护方式以及产品
导航: 这里将一个案例事项按照流程进行了整合,这样查看起来比较清晰.部分资料来自于Cloudflare 1.DDoS介绍 2.常用DDoS攻击 3.DDoS防护方式以及产品 4.Cloudflare ...
.Net Core：限流
一.环境 1.vs2019 2..Net Core 3.1 3.引用 AspNetCoreRateLimit 4.0.1 二.基础使用 1.设置在Startup文件中配置如下,把配置项都放在前面: ...
8、负载均衡HAproxy部署
8.1.基本环境说明: 服务器名(centos7) ip地址安装软件 slave-node1 172.16.1.91 haproxy1.8.15,tomcat8.5.37(8080.8081实例), ...
集合类线程安全吗？ConcurrentModification异常遇到过吗？如何解决？
集合类不安全的问题 1. ArrayList的线程不安全问题 1.1 首先回顾ArrayList底层 ArrayList的底层数据结构是数组底层是一个Object[] elementData的数组, ...
POJ 1220 大数字的进制转换，偷下懒，用java
题意为进制转换,Java的大数类就像是作弊 import java.math.BigInteger; import java.util.Scanner; public class Main { pub ...

django2.1实现全文检索（最详细）+遇到的坑+jieba分词

django2.1实现全文检索（最详细）+遇到的坑+jieba分词的更多相关文章

随机推荐

热门专题