全文检索

全文检索效率更高，对中文可以进行分词

<!--# 1.安装包-->

pip install django-haystack

pip install whoosh

pip install jieba

<!--# 2.生成一个新的app或者之前的app也可以,setting中的配置-->

'haystacktest',

'haystack',

<!--# haystack是必须要写的-->

<!--# 添加搜索引擎-->

HAYSTACK_CONNECTIONS = {

    'default':{

        'ENGINE':'haystack.backends.whoosh_cn_backend.WhooshEngine',

        'PATH':os.path.join(BASE_DIR,'whoosh_index'),

    }

}

<!--# 自动生成索引-->

HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

<!--# 3. url-->

# golbal search

    url(r'sea/',include('haystacktest.urls',namespace='search')),

    # 这个URL是必须要写的

	url(r'^search/', include('haystack.urls')),

<!--# 4. 在当前的app中新建一个search_indexes.py 文件-->

# -*- coding:utf-8 -*-

from haystack import indexes

from .models import Test1

class TestIndex(indexes.SearchIndex,indexes.Indexable):

    text = indexes.CharField(document=True,use_template=True)

    def get_model(self):

        return Test1

    # 对哪个表的哪个数据进行检索，可以在后面写上过滤条件

    def index_queryset(self, using=None):

        return self.get_model().objects.all()

<!--# 5. 在目录templates/search/indexes/上面那个文件所在的app的名字/模型类名字_text.txt-->

<!--# 注意 object是必须要写的-->

{{ object.name }}

{{ object.age }}

{{ object.sex }}

<!--# 6.在目录templates/search中建立一个search.html-->

<!DOCTYPE html>

<html>

<head>

    <title></title>

</head>

<body>

{% if query %}

    <h3>搜索结果如下：</h3>

    {% for result in page.object_list %}

        {{ result.object.id }}

        <br>

        {{ result.object.content|safe }}

        <hr>

    {% empty %}

        <p>啥也没找到</p>

    {% endfor %}

    {% if page.has_previous or page.has_next %}

        <div>

            {% if page.has_previous %}<a href="?q={{ query }}&amp;page={{ page.previous_page_number }}">{% endif %}&laquo; 上一页{% if page.has_previous %}</a>{% endif %}

        |

            {% if page.has_next %}<a href="?q={{ query }}&amp;page={{ page.next_page_number }}">{% endif %}下一页 &raquo;{% if page.has_next %}</a>{% endif %}

        </div>

    {% endif %}

{% endif %}

</body>

</html>

<!--# 7.在C:\Python27\Lib\site-packages\haystack\backends中新建一个文件-->

<!--# ChineseAnalyzer.py 下面的代码是使用jieba必须的-->

import jieba

from whoosh.analysis import RegexAnalyzer

from whoosh.analysis import Tokenizer,Token

class ChineseTokenizer(Tokenizer):

    def __call__(self, value, positions=False, chars=False,

                 keeporiginal=False, removestops=True,

                 start_pos=0, start_char=0, mode='', **kwargs):

        #assert isinstance(value, text_type), "%r is not unicode" % value

        t = Token(positions, chars, removestops=removestops, mode=mode,

            **kwargs)

        seglist=jieba.cut(value,cut_all=True)

        for w in seglist:

            t.original = t.text = w

            t.boost = 1.0

            if positions:

                t.pos=start_pos+value.find(w)

            if chars:

                t.startchar=start_char+value.find(w)

                t.endchar=start_char+value.find(w)+len(w)

            yield t

def ChineseAnalyzer():

    return ChineseTokenizer()

<!--# 8.复制C:\Python27\Lib\site-packages\haystack\backends中的whoosh_backend.py 把它改为whoosh_cn_backend.py-->

from .ChineseAnalyzer import ChineseAnalyzer

将原来的analyzer=StemmingAnalyzer()

改为analyzer=ChineseAnalyzer()

<!--# 9.生成索引之后会自动生成之前设置中设置的文件夹 whoosh_index-->

python manage.py rebuild_index

<!--# 10 创建搜索 -->

<!--# 在模版中创建搜索栏-->

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"

        "http://www.w3.org/TR/html4/loose.dtd">

<html>

<head>

    <title>Title</title>

</head>

<body>

<!--/search/对应url(r'^search/', include('haystack.urls')),-->

<form action="/search/" target="_blank" method="get">

{#    这里的name必须是q   #}

    <input type="text" name="q">

    <input type="submit" value="搜索">

</form>

</body>

</html>

<!---->

urlpatterns = [

    url(r'^$',mysearch)

 ]

<!---->

def mysearch(request):

    return render(request,'mysearch.html')

注意

还可以自定义搜索结果出现的上下文，需要先注释掉总的URL中的search然后在搜索所在的app的view中重新写视图，在当前的urls中新增一个链接，具体的查看Django-haystack文档

# view

from haystack.views import SearchView

class MySearchView(SearchView):

    def extra_context(self):

        context = super(MySearchView,self).extra_context()

        context['new'] = 'a'

        return context

# url 这里和一般的视图类的写法不一样哦。

url(r'^search',MySearchView())

Django积木块十——全文检索的更多相关文章

Django积木块八——三级联动
三级联动前端需要的效果,省之后市之后现,创建model,查询所有的省的信息,json传到前面,之后通过省的id找到对应的市,是用异步实现的. # model class Sheng(models.M ...
Django积木块六——验证用户是否登录
验证用户是否登录 # 开始在用户登录的时候验证结束后login登录 # request.user.is_authenticated() {% if request.user.is_authentica ...
Django积木块五——分页
分页 django本身带有分页功能,为什么要用他呢?因为它的代码更为简洁,并且在做筛选的时候会把url中的所有参数都组装起来,并且加上分页.也就是做筛选中的结果也可以用这个分页. pip instal ...
Django积木块三——静态文件和上传文件
静态文件和上传的文件 # 静态文件 STATIC_URL = '/static/' STATICFILES_DIRS = ( os.path.join(BASE_DIR, 'static'), ) # ...
Django积木块二——邮箱
邮箱 django中自带的功能,因为登录注册都需要邮箱,因此新增了一个小的app--utils用来存放 # email_send.py import random from django.core.m ...
Django积木块九——富文本编辑器
富文本编辑器前端和后端都可以用富文本编辑器 # pip install django-tinymce # setting 'tinymce' TINYMCE_DEFAULT_CONFIG = { ' ...
Django积木块七——视频
视频 # 在网上搜索video.js然后下载相关的js和css文件,看文档正确使用视频模块,添加视频外链 <div style="width: 1200px;height: 675px ...
Django积木块一——验证码
验证码在github中搜验证码,那个有使用文档 # pip install django-simple-captcha==0.4.6 # setting app captcha # url url( ...
Django学习之十: staticfile 静态文件
目录 Django学习之十: staticfile 静态文件理解阐述静态文件 Django对静态文件的处理其它方面总结 Django学习之十: staticfile 静态文件理解阐述 ...

随机推荐

DOM节点遍历
"DOM2级遍历和范围"模块定义了两个用于辅助完成顺序遍历DOM结构的类型:NodeIterator 和 TreeWalker .这两个类型能够根据给定的节点对DOM结构进行深度优 ...
flask中缓存cache导入时引发的错误
安装 pip install flask-cache 初始化 from flask_cache import Cache cache = Cache(config={ 'CACHE_TYPE': 's ...
linux学习笔记：关于环境变量
(摘自https://blog.csdn.net/llzk_/article/details/53813266之后整合) 1.linux系统的条件 Linux是一个多用户的操作系统,每个用户登录系统时 ...
SQL数据库索引理解与应用【转贴--收藏】
SQL数据库中索引分为聚集索引(CLUSTERED)和非聚集索引(NONCLUSTERED)两种. 聚集索引确定表中数据的物理顺序,它就类似与电话簿,按照姓氏排列数据.由于聚集索引规定数据表中的物理顺 ...
char* = "name" g++报告warn的原因
char* str = { "abcd" },先定义一个字符串常量“abcd“,再将指针str指向它,返回值是这个指针,由于字符串常量在编译时分配内存,只有程序退出时才被销毁,所以 ...
Centos 6.5使用vsftpd配置FTP服务器教程
Centos 6.5使用vsftpd配置FTP服务器教程什么是vsftpd vsftpd是一款在Linux发行版中最受推崇的FTP服务器程序.特点是小巧轻快,安全易用.vsftpd 的名字代表”ver ...
[剑指Offer]10-斐波那契数列(循环)-Java
题解使用循环,时间复杂度O(n). 相关跳台阶:f(n)=f(n-1)+f(n-2) 变态跳台阶:f(n)=2*f(n-1) 矩形覆盖:f(n)=f(n-1)+f(n-2) 全部用循环代替递归,使 ...
微信小程序记账本进度七
最后大体上完成了,但是好像少了点功能,整体并不是特别华丽
Loadrunner 11.00录制App脚本篇（Win10）
参考博文1:https://www.cnblogs.com/mxqh2016/p/6016866.html 参考博文2:https://blog.csdn.net/myohmy2008/article ...
pythone函数基础（13）发送网络请求
需要导入urllib模块,request模块发送网络请求有两种方法第一种方法# from urllib.request import urlopen# from urllib.parse impor ...

Django积木块十——全文检索

全文检索

注意

Django积木块十——全文检索的更多相关文章

随机推荐

热门专题