Django积木块十——全文检索
全文检索
全文检索效率更高,对中文可以进行分词
<!--# 1.安装包-->
pip install django-haystack
pip install whoosh
pip install jieba
<!--# 2.生成一个新的app或者之前的app也可以,setting中的配置-->
'haystacktest',
'haystack',
<!--# haystack是必须要写的-->
<!--# 添加搜索引擎-->
HAYSTACK_CONNECTIONS = {
'default':{
'ENGINE':'haystack.backends.whoosh_cn_backend.WhooshEngine',
'PATH':os.path.join(BASE_DIR,'whoosh_index'),
}
}
<!--# 自动生成索引-->
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'
<!--# 3. url-->
# golbal search
url(r'sea/',include('haystacktest.urls',namespace='search')),
# 这个URL是必须要写的
url(r'^search/', include('haystack.urls')),
<!--# 4. 在当前的app中新建一个search_indexes.py 文件-->
# -*- coding:utf-8 -*-
from haystack import indexes
from .models import Test1
class TestIndex(indexes.SearchIndex,indexes.Indexable):
text = indexes.CharField(document=True,use_template=True)
def get_model(self):
return Test1
# 对哪个表的哪个数据进行检索,可以在后面写上过滤条件
def index_queryset(self, using=None):
return self.get_model().objects.all()
<!--# 5. 在目录templates/search/indexes/上面那个文件所在的app的名字/模型类名字_text.txt-->
<!--# 注意 object是必须要写的-->
{{ object.name }}
{{ object.age }}
{{ object.sex }}
<!--# 6.在目录templates/search中建立一个search.html-->
<!DOCTYPE html>
<html>
<head>
<title></title>
</head>
<body>
{% if query %}
<h3>搜索结果如下:</h3>
{% for result in page.object_list %}
{{ result.object.id }}
<br>
{{ result.object.content|safe }}
<hr>
{% empty %}
<p>啥也没找到</p>
{% endfor %}
{% if page.has_previous or page.has_next %}
<div>
{% if page.has_previous %}<a href="?q={{ query }}&page={{ page.previous_page_number }}">{% endif %}« 上一页{% if page.has_previous %}</a>{% endif %}
|
{% if page.has_next %}<a href="?q={{ query }}&page={{ page.next_page_number }}">{% endif %}下一页 »{% if page.has_next %}</a>{% endif %}
</div>
{% endif %}
{% endif %}
</body>
</html>
<!--# 7.在C:\Python27\Lib\site-packages\haystack\backends中新建一个文件-->
<!--# ChineseAnalyzer.py 下面的代码是使用jieba必须的-->
import jieba
from whoosh.analysis import RegexAnalyzer
from whoosh.analysis import Tokenizer,Token
class ChineseTokenizer(Tokenizer):
def __call__(self, value, positions=False, chars=False,
keeporiginal=False, removestops=True,
start_pos=0, start_char=0, mode='', **kwargs):
#assert isinstance(value, text_type), "%r is not unicode" % value
t = Token(positions, chars, removestops=removestops, mode=mode,
**kwargs)
seglist=jieba.cut(value,cut_all=True)
for w in seglist:
t.original = t.text = w
t.boost = 1.0
if positions:
t.pos=start_pos+value.find(w)
if chars:
t.startchar=start_char+value.find(w)
t.endchar=start_char+value.find(w)+len(w)
yield t
def ChineseAnalyzer():
return ChineseTokenizer()
<!--# 8.复制C:\Python27\Lib\site-packages\haystack\backends中的whoosh_backend.py 把它改为whoosh_cn_backend.py-->
from .ChineseAnalyzer import ChineseAnalyzer
将原来的analyzer=StemmingAnalyzer()
改为analyzer=ChineseAnalyzer()
<!--# 9.生成索引之后会自动生成之前设置中设置的文件夹 whoosh_index-->
python manage.py rebuild_index
<!--# 10 创建搜索 -->
<!--# 在模版中创建搜索栏-->
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>Title</title>
</head>
<body>
<!--/search/对应url(r'^search/', include('haystack.urls')),-->
<form action="/search/" target="_blank" method="get">
{# 这里的name必须是q #}
<input type="text" name="q">
<input type="submit" value="搜索">
</form>
</body>
</html>
<!---->
urlpatterns = [
url(r'^$',mysearch)
]
<!---->
def mysearch(request):
return render(request,'mysearch.html')
注意
还可以自定义搜索结果出现的上下文,需要先注释掉总的URL中的search然后在搜索所在的app的view中重新写视图,在当前的urls中新增一个链接,具体的查看Django-haystack文档
# view
from haystack.views import SearchView
class MySearchView(SearchView):
def extra_context(self):
context = super(MySearchView,self).extra_context()
context['new'] = 'a'
return context
# url 这里和一般的视图类的写法不一样哦。
url(r'^search',MySearchView())
Django积木块十——全文检索的更多相关文章
- Django积木块八——三级联动
三级联动 前端需要的效果,省之后市之后现,创建model,查询所有的省的信息,json传到前面,之后通过省的id找到对应的市,是用异步实现的. # model class Sheng(models.M ...
- Django积木块六——验证用户是否登录
验证用户是否登录 # 开始在用户登录的时候验证结束后login登录 # request.user.is_authenticated() {% if request.user.is_authentica ...
- Django积木块五——分页
分页 django本身带有分页功能,为什么要用他呢?因为它的代码更为简洁,并且在做筛选的时候会把url中的所有参数都组装起来,并且加上分页.也就是做筛选中的结果也可以用这个分页. pip instal ...
- Django积木块三——静态文件和上传文件
静态文件和上传的文件 # 静态文件 STATIC_URL = '/static/' STATICFILES_DIRS = ( os.path.join(BASE_DIR, 'static'), ) # ...
- Django积木块二——邮箱
邮箱 django中自带的功能,因为登录注册都需要邮箱,因此新增了一个小的app--utils用来存放 # email_send.py import random from django.core.m ...
- Django积木块九——富文本编辑器
富文本编辑器 前端和后端都可以用富文本编辑器 # pip install django-tinymce # setting 'tinymce' TINYMCE_DEFAULT_CONFIG = { ' ...
- Django积木块七——视频
视频 # 在网上搜索video.js然后下载相关的js和css文件,看文档正确使用视频模块,添加视频外链 <div style="width: 1200px;height: 675px ...
- Django积木块一——验证码
验证码 在github中搜验证码,那个有使用文档 # pip install django-simple-captcha==0.4.6 # setting app captcha # url url( ...
- Django学习之十: staticfile 静态文件
目录 Django学习之十: staticfile 静态文件 理解阐述 静态文件 Django对静态文件的处理 其它方面 总结 Django学习之十: staticfile 静态文件 理解阐述 ...
随机推荐
- 深入理解C++11【2】
[深入理解C++11[2]] 1.继承构造函数. 当基类拥有多个构造函数的时候,子类不得不一一实现. C++98 可以使用 using 来使用基类的成员函数. #include < iostre ...
- Linux 内核态 用户态
内核态和用户态最主要区别在于权限不同,比如特权级别0-3,0级就意味着进入内核态,分级别之后,应该程序大部分情况下运行在用户态,保证了程序运行的安全性 什么情况下会发生从用户态向内核态切换.这里细分为 ...
- docker for mac
MacOS上通过docker部署 docker环境准备 1.访问这里安装好docker,需要注册账号才能下载dmg安装包:https://hub.docker.com/editions/communi ...
- Codeforces Round #553 (Div. 2) B题
题目网址:http://codeforces.com/contest/1151/problem/B 题目大意:给定一个n*m的矩阵,问是否可以从每一行中选择一个数,使得这n个数异或大于0,如果可以还要 ...
- spring微服务架构-脑图
spring团队对新一代软件开发的思索.为什么软件开发是spring boot?为什么软件开发是spring cloud?如何使用spring cloud搭建微服务. 清晰脑图查看
- 微信小程序实战[01]
接触微信小程序也有一段时间了,以天气预报练一下手. 主要实现了以下功能: (1) 首页图标式菜单,便于以后扩展功能 (2)首页顶部滚动消息 (3)页面右上角三点菜单转发功能,便于小程序的传播 (4)天 ...
- Django实现文件的上传
Django实现文件的上传 1.前端页面:使用file对象,读取文件对象传递到views中.需要设定enctype="multipart/form-data",表明不对字符进行编码 ...
- Read-only file system
mount -o remount rw /
- svn2个小问题的解决
Revision file (r615) lacks trailing newline /svndata/your_project/db/revs /svndata/your_project/db/r ...
- Python学习笔记:基础
本文根据廖雪峰的博客,学习整理笔记.主要内容有:基本数据类型,容器数据类型,变量及其作用域,判断及循环语法,函数式编程,面向对象,模块等概念. 数据类型 在python中,能够直接处理的数据类型有以下 ...