Django积木块十——全文检索
全文检索
全文检索效率更高,对中文可以进行分词
<!--# 1.安装包-->
pip install django-haystack
pip install whoosh
pip install jieba
<!--# 2.生成一个新的app或者之前的app也可以,setting中的配置-->
'haystacktest',
'haystack',
<!--# haystack是必须要写的-->
<!--# 添加搜索引擎-->
HAYSTACK_CONNECTIONS = {
'default':{
'ENGINE':'haystack.backends.whoosh_cn_backend.WhooshEngine',
'PATH':os.path.join(BASE_DIR,'whoosh_index'),
}
}
<!--# 自动生成索引-->
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'
<!--# 3. url-->
# golbal search
url(r'sea/',include('haystacktest.urls',namespace='search')),
# 这个URL是必须要写的
url(r'^search/', include('haystack.urls')),
<!--# 4. 在当前的app中新建一个search_indexes.py 文件-->
# -*- coding:utf-8 -*-
from haystack import indexes
from .models import Test1
class TestIndex(indexes.SearchIndex,indexes.Indexable):
text = indexes.CharField(document=True,use_template=True)
def get_model(self):
return Test1
# 对哪个表的哪个数据进行检索,可以在后面写上过滤条件
def index_queryset(self, using=None):
return self.get_model().objects.all()
<!--# 5. 在目录templates/search/indexes/上面那个文件所在的app的名字/模型类名字_text.txt-->
<!--# 注意 object是必须要写的-->
{{ object.name }}
{{ object.age }}
{{ object.sex }}
<!--# 6.在目录templates/search中建立一个search.html-->
<!DOCTYPE html>
<html>
<head>
<title></title>
</head>
<body>
{% if query %}
<h3>搜索结果如下:</h3>
{% for result in page.object_list %}
{{ result.object.id }}
<br>
{{ result.object.content|safe }}
<hr>
{% empty %}
<p>啥也没找到</p>
{% endfor %}
{% if page.has_previous or page.has_next %}
<div>
{% if page.has_previous %}<a href="?q={{ query }}&page={{ page.previous_page_number }}">{% endif %}« 上一页{% if page.has_previous %}</a>{% endif %}
|
{% if page.has_next %}<a href="?q={{ query }}&page={{ page.next_page_number }}">{% endif %}下一页 »{% if page.has_next %}</a>{% endif %}
</div>
{% endif %}
{% endif %}
</body>
</html>
<!--# 7.在C:\Python27\Lib\site-packages\haystack\backends中新建一个文件-->
<!--# ChineseAnalyzer.py 下面的代码是使用jieba必须的-->
import jieba
from whoosh.analysis import RegexAnalyzer
from whoosh.analysis import Tokenizer,Token
class ChineseTokenizer(Tokenizer):
def __call__(self, value, positions=False, chars=False,
keeporiginal=False, removestops=True,
start_pos=0, start_char=0, mode='', **kwargs):
#assert isinstance(value, text_type), "%r is not unicode" % value
t = Token(positions, chars, removestops=removestops, mode=mode,
**kwargs)
seglist=jieba.cut(value,cut_all=True)
for w in seglist:
t.original = t.text = w
t.boost = 1.0
if positions:
t.pos=start_pos+value.find(w)
if chars:
t.startchar=start_char+value.find(w)
t.endchar=start_char+value.find(w)+len(w)
yield t
def ChineseAnalyzer():
return ChineseTokenizer()
<!--# 8.复制C:\Python27\Lib\site-packages\haystack\backends中的whoosh_backend.py 把它改为whoosh_cn_backend.py-->
from .ChineseAnalyzer import ChineseAnalyzer
将原来的analyzer=StemmingAnalyzer()
改为analyzer=ChineseAnalyzer()
<!--# 9.生成索引之后会自动生成之前设置中设置的文件夹 whoosh_index-->
python manage.py rebuild_index
<!--# 10 创建搜索 -->
<!--# 在模版中创建搜索栏-->
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>Title</title>
</head>
<body>
<!--/search/对应url(r'^search/', include('haystack.urls')),-->
<form action="/search/" target="_blank" method="get">
{# 这里的name必须是q #}
<input type="text" name="q">
<input type="submit" value="搜索">
</form>
</body>
</html>
<!---->
urlpatterns = [
url(r'^$',mysearch)
]
<!---->
def mysearch(request):
return render(request,'mysearch.html')
注意
还可以自定义搜索结果出现的上下文,需要先注释掉总的URL中的search然后在搜索所在的app的view中重新写视图,在当前的urls中新增一个链接,具体的查看Django-haystack文档
# view
from haystack.views import SearchView
class MySearchView(SearchView):
def extra_context(self):
context = super(MySearchView,self).extra_context()
context['new'] = 'a'
return context
# url 这里和一般的视图类的写法不一样哦。
url(r'^search',MySearchView())
Django积木块十——全文检索的更多相关文章
- Django积木块八——三级联动
三级联动 前端需要的效果,省之后市之后现,创建model,查询所有的省的信息,json传到前面,之后通过省的id找到对应的市,是用异步实现的. # model class Sheng(models.M ...
- Django积木块六——验证用户是否登录
验证用户是否登录 # 开始在用户登录的时候验证结束后login登录 # request.user.is_authenticated() {% if request.user.is_authentica ...
- Django积木块五——分页
分页 django本身带有分页功能,为什么要用他呢?因为它的代码更为简洁,并且在做筛选的时候会把url中的所有参数都组装起来,并且加上分页.也就是做筛选中的结果也可以用这个分页. pip instal ...
- Django积木块三——静态文件和上传文件
静态文件和上传的文件 # 静态文件 STATIC_URL = '/static/' STATICFILES_DIRS = ( os.path.join(BASE_DIR, 'static'), ) # ...
- Django积木块二——邮箱
邮箱 django中自带的功能,因为登录注册都需要邮箱,因此新增了一个小的app--utils用来存放 # email_send.py import random from django.core.m ...
- Django积木块九——富文本编辑器
富文本编辑器 前端和后端都可以用富文本编辑器 # pip install django-tinymce # setting 'tinymce' TINYMCE_DEFAULT_CONFIG = { ' ...
- Django积木块七——视频
视频 # 在网上搜索video.js然后下载相关的js和css文件,看文档正确使用视频模块,添加视频外链 <div style="width: 1200px;height: 675px ...
- Django积木块一——验证码
验证码 在github中搜验证码,那个有使用文档 # pip install django-simple-captcha==0.4.6 # setting app captcha # url url( ...
- Django学习之十: staticfile 静态文件
目录 Django学习之十: staticfile 静态文件 理解阐述 静态文件 Django对静态文件的处理 其它方面 总结 Django学习之十: staticfile 静态文件 理解阐述 ...
随机推荐
- cat <<EOF
1.cat >file记录的是键盘输入,相当于从键盘创建文件,并且只能创建新文件,不能编辑已有文件.>是数据重导向,会将你输入的文本内容输出到file中. 2.cat <<EO ...
- time 命令
语法 time [options] COMMAND [arguments] 参数 -o 或 --output=FILE:设定结果输出档.这个选项会将 time 的输出写入 所指定的档案中.如果档案已经 ...
- 第二周博客作业 <西北师范大学| 周安伟>
一,本周助教小结 逐步开始适应助教工作,对学生发布的博客进行点评,查看学生对软件工程前期的准备情况. 二,助教本人博客 https://home.cnblogs.com/u/zaw-315/ 三,学生 ...
- CentOS 7 安装与卸载MySQL 5.7
先介绍卸载 防止重装 yum方式 查看yum是否安装过mysql yum list installed mysql* 如或显示了列表,说明系统中有MySQL yum卸载 根据列表上的名字 yum re ...
- web配置详细解释
<?xml version="1.0"?> <!--注意: 除了手动编辑此文件以外,您还可以使用 Web 管理工具来配置应用程序的设置.可以使用 Visual S ...
- 设计模式之装饰者模式-java实例
设计模式之装饰者模式 需求场景 我们有了别人提供的产品,但是别人提供的产品对我们来说还不够完善,我们需要对这个产品的功能进行补强,此时可以考虑使用装饰者模式. 我们已经有了产品,而且这个产品的功能非常 ...
- Zookeeper到底是干嘛的
在Zookeeper的官网上有这么一句话:ZooKeeper is a centralized service for maintaining configuration information, n ...
- ROS零门槛学渣教程系列(二)——Linux常用指令:mkdir、tar、 unzip、cp、scp、mv、rm、find、apt、ssh
Linux常用指令通过上一教程,我们获得了ubuntu系统.Linux是一个很大的领域.但不要紧张,我们一步步来就是了,跟着教程,需要能用到新知识,会提前介绍给大家.下面学习几个常用的Linux指令. ...
- pytesseract在识别只有一个数字的图片时识别不出来
大家好,近期在做自动化测试时,遇到了一个问题需要通过识别图片来实现,遂用到了pytesseract模块和tesseract-ocr这个工具.在使用过程中发现,识别带有数字的图片时,如果这个图片上仅有一 ...
- P2880 [USACO07JAN]平衡的阵容Balanced Lineup(RMQ的倍增模板)
题面:P2880 [USACO07JAN]平衡的阵容Balanced Lineup RMQ问题:给定一个长度为N的区间,M个询问,每次询问Li到Ri这段区间元素的最大值/最小值. RMQ的高级写法一般 ...