[solr] - spell check】的更多相关文章

solr提供了一个spell check,又叫suggestions,可以用于查询输入的自动完成功能auto-complete. 参考文献: https://cwiki.apache.org/confluence/display/solr/Spell+Checking http://www.cnblogs.com/ibook360/archive/2011/11/30/2269077.html 方法: 修改core的solrconfig.xml 加入这段到<config />内 <sea…
VIM 拼写检查/spell check 一.Hunspell科普 Hunspell 作为一个拼写检查的工具,已经用在了许多开源的以及商业软件中.包括Google Chrome, Libreoffice等. 二.Vimspell使用 Use :set spell to turn on spell-checking. If it's source code, gvim is smart enough to only spellcheck comments and string literals.…
拼写检查也是搜索引擎必备的功能.Solr中提供了SpellCheckComponent 来实现此功能.我看过<Solr In Action>,是基于Solr4.X版本的,那时Suggestion 和 SpellCheck 用的是同一个组件.我个人感觉这两个其实也可以归为同一类概念.当你在搜索框中输入拼写错误的单词时,找不到符合此错误单词的suggest 项,应该加入较正后的单词.试了一下度娘和谷哥,输入拼写错误的单词时,它会在suggestion里直接提供正确拼写的单词.Solr 6.X里增加…
link: http://johnlamansky.com/tech/disable-word-spell-check/ 引用: Word 2010 Click the “File” button Click “Options” on the left Click “Proofing” Check “Hide spelling errors in this document only” and/or “Hide grammar errors in this document only” Clic…
1. SpellCheck SpellCheck组件设计的目的是基于其他,相似,terms来提供内联查询建议.这些建议的依据可以是solr字段中的terms,外部可以创建文本文件, 或者其实lucene索引. 1.1 配置SpellCheckComponent 1.1.1 在solrconfig.xml中定义spell check 1.1.1.1 IndexBasedSpellChecker IndexBasedSpellChecker使用solr索引作为拼写检车的并行索引.它要求定义一个字段作…
拼写检查功能,能在搜索时,提供一个较好用户体验,所以,主流的搜索引擎都有这个功能. 那么什么是拼写检查,其实很好理解,就是你输入的搜索词,可能是你输错了,也有可能在它的检索库里面根本不存在这个词,但是这时候它能给你返回,相似或相近的结果来帮助你校正.举个例子,假如你在百度里面输入在在线电瓶,可能它的索引库里面就没有,但是它有可能返回在线电影,在线电视,在线观看等等一些词,这些,就用到拼写检查的功能了. solr是一个基于lucene开发接口实现的成熟的搜索系统,通过不同的控件(Component…
原文地址:https://gist.github.com/maxivak/3e3ee1fca32f3949f052 Install Solr download and install Solr from http://lucene.apache.org/solr/. you can access Solr admin from your browser: http://localhost:8983/solr/ use the port number used in installation. M…
位于:${solr.home}\example\techproducts\solr\techproducts\conf\solrconfig.xml <?xml version="1.0" encoding="UTF-8" ?> <!-- Licensed to the Apache Software Foundation (ASF) under one or more contributor license agreements. See the…
上一篇讲述了solr的安装启动过程,这一篇讲述如何导入数据到solr里. 一.准备数据 1.1 学生相关表 创建学生表.学生专业关联表.专业表.学生行业关联表.行业表.基础信息表,并创建一条小白的信息.由于navicat收费,所以这里利用HeidiSQL连接本地的MySql建立表. 1.2查询数据 查询出要导入solr的数据 二.添加jar包 2.1 添加mysql数据库驱动包 下载jar包,并放入到../solr-7.7.2/server/solr-webapp/webapp/WEB-INF/…
1.下载相关软件,并解压 版本号如下: (1)apache-nutch-2.3 (2) hadoop-1.2.1 (3)hbase-0.92.1 (4)solr-4.9.0 并解压至/opt/jediael. 若要下载最新的开发版本nutch,可以进行以下操作 svn co https://svn.apache.org/repos/asf/nutch/branches/2.x 2.安装hadoop1.2.1集群环境 见http://blog.csdn.net/jediael_lu/article…
1.下载相关软件,并解压 版本号如下: (1)apache-nutch-2.2.1 (2) hbase-0.90.4 (3)solr-4.9.0 并解压至/usr/search 2.Nutch的配置 (1)vi /usr/search/apache-nutch-2.2.1/conf/nutch-site.xml <property> <name>storage.data.store.class</name> <value>org.apache.gora.hb…
今天主要是收集了些拼写检查方面的资料和 尝试使用一下拼写检查的功能--=遇到了不少问题 拼写检查的四种配置眼下我仅仅算是成功了半个吧 --------------------------------- 拼写检查功能,能在搜索时,提供一个较好用户体验.所以,主流的搜索引擎都有这个功能.在这之前,笔者先简单的说一下什么是拼写检查,事实上非常好理解.就是你输入的搜索词,可能是你输错了,也有可能在它的检索库里面根本不存在这个词.可是这时候它能给你返回,相似或相近的结果来帮助你校正. 举个样例.假如你在百…
如何在Texstudio编辑软件内加载"语法检查词典"? How to make dictionary work in TexStudio I am using TexStudio as my LaTex IDE and honestly speaking I find it better than others available for the same purpose. One of the advantages is that you can use dictionary fo…
Indexes and search engines These sites provide indexes and search engines for Go packages: godoc.org gowalker gosearch Sourcegraph Contributing To edit this page you must be a contributor to the go-wiki project. To get contributor access, send mail t…
前面3个月的时间内,这些.NET开源项目你知道吗?系列文章已经发表了3篇,共计45个平时接触比较少,曾经默默无闻的.NET开源项目,展示给大家,当然不是每个人都能用得上,但也的确是有些人用了,反响还不错,所以非常感谢大家的支持.由于收藏夹的项目越来越少,越整理到最后,越发现一些问题,所以就按专题来分开.今天分享给大家的是关于WinForm开发相关的小巧灵活的开源项目.虽然现在WinForm开发可能不常见了,都转向B/S了,但偶尔还是有用到的地方的,特别是学校,以及一些研究演示之类的.所以这篇文章…
Welcome to MarkdownPad 2 MarkdownPad is a full-featured Markdown editor for Windows. Built exclusively for Markdown Enjoy first-class Markdown support with easy access to Markdown syntax and convenient keyboard shortcuts. Give them a try: Bold (Ctrl+…
Bash的启动文件 启动文件也是一种脚本,不过它是在Bash在启动之初就执行它的.不同的启动方式使用的启动文件也有不同. 1. 作为交互的登录脚本环境“交互的”是指你可以再这个环境下输入命令.而所谓的登录,则是需要你输入用户名和密码之后,才能启动shell环境.比如你使用的tty0~tty6等几个terminal,就是需要登入的shell环境.这种启动方式下,bash会读取下列配置文件./etc/profile~/.bash_profile,~/.bash_login,~/.profile~/.…
1.取消自动validation 有一堆,什么xml.jsp.jsf.js等等, 我们没有必要全部都去自动校验一下,只是需要的时候才会手工校验一下! 取消方法: windows-->perferences-->myeclipse–->validation 除开Manual下面的复选框全部选中之外,其他全部不选 手工验证方法: 在要验证的文件上,单击鼠标右键--->myeclipse--->run validation 2.取消Eclipse拼写检查 拼写检查会给我们带来不少的…
前言 在以往的java开发中,程序员最怕大量的配置,是因为配置一多就不好统一管理,经常出现找不到配置的情况.而项目中,从开发测试环境到生产环境,往往需要切换不同的配置,如测试数据库连接换成生产数据库连接,若有一处配错或遗漏,就会带来不可挽回的损失.正因为这样,spring boot给出了非常理想的解决方案——application.properties.见application-properties的官方文档:http://docs.spring.io/spring-boot/docs/curr…
http://www.micmiu.com/opensource/nutch/nutch2x-crawl-first-website/?utm_source=tuicool&utm_medium=referral 下面演示的过程是基于目前 Nutch 2.2.1 自己编译配置的版本. 在编译后 bin目录下有两个脚本文件:nutch 和 crawl ,在命令行下执行各命令即可查看具体使用说明:     1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19…
/×××××××××××××××××××××××××××××××××××××××××/ Author:xxx0624 HomePage:http://www.cnblogs.com/xxx0624/ /×××××××××××××××××××××××××××××××××××××××××/ 利用ant编译nutch2.x 详见:1.    http://blog.javachen.com/2014/05/20/nutch-intro/   2.    wiki.apache.org/nutch/Nu…
This Chapter outlines the logical steps to writing a good research paper. To achieve supreme excellence or perfection in anything you do, you need more than just the knowledge. Like the Olympic athlete aiming for the gold medal, you must have a posit…
1.指定本机java环境 Windows-->preferences-->java-->Insetallel JREs 右侧 单击ADD-->standard VM-->Next-->Directory-->Finash 点选 新增jre环境-->点击OK 2.更换背景颜色 个人感觉白色比较刺激眼睛 可选择性更换 Windows-->preferences-->General-->Editors-->Text Editors 右侧左下…
# =================================================================== # COMMON SPRING BOOT PROPERTIES # # This sample file is provided as a guideline. Do NOT copy it in its # entirety to your own application. ^^^ # ===================================…
原文地址:http://bbs.csdn.net/topics/350165431 SQL Server 一直没有一款很好的源码控制器,之前自己曾尝试自己写一个,将所有的 脚本 自动生成到某一目录下,然后将该目录提交到SVN中,进行管理,但是由于 有些存储过程中的 引号太多,没能把脚本完整的导出,最后只好搁浅 了. 昨天在逛国外论坛时 ,遇到了一款很强大的工具. 只有 20多天的使用期限,我在国外没找到 序列号,在国内发现没有研究这个工具的Programer. 所以分享给大家,一起来研究下. 我…
github的编辑器atom 1.0已经出来了,在https://atom.io/ 我之前在win上一直用notepad++写了两年脚本.最近改写lua了,项目组统一用的sublime text.sublime text在win下输入中文光标不跟随(好像有解决办法,没去折腾),而在ubuntu下直接是没法输入中文.看到atom出来了,赶紧试用一把. 说实在的,跟sublime text还是很像的,快捷键ctrl+p这些都一样.所以使用上就不说什么了,说一下设置.atom的设置界面比sublime…
在对nutch源代码运行ant runtime后,会创建一个runtime的目录,在runtime目录下有deploy和local 2个目录. [jediael@jediael runtime]$ ls deploy  local 这2个目录分别代表nutch的2种运行方式:部署模式及本地模式. 1.nutch.sh中关于2种运行方式的执行 if $local; then # fix for the external Xerces lib issue with SAXParserFactory…
转http://www.open-open.com/lib/view/open1396063913278.html内容目录Astronomy构建工具缓存云计算命令行选项解析器命令行工具压缩配置文件解析器控制台用户界面加密数据处理数据结构数据库和存储开发工具分布式/网格计算文档编辑器Encodings and Character SetsGamesGISGo ImplementationsGraphics and AudioGUIs and Widget ToolkitsHardwareLangu…
$ cat ~/.vimrc,centos7是在/etc/vimrc文件中配置. nmap <C-_>s :cs find s <C-R>=expand("<cword>")<CR><CR>nmap <C-_>g :cs find g <C-R>=expand("<cword>")<CR><CR>nmap <C-_>c :cs find…
原文:Red Gate系列之二 SQL Source Control 3.0.13.4214 Edition 数据库版本控制器 完全破解+使用教程 Red Gate系列之二 SQL Source Control 3.0.13.4214 Edition 数据库版本控制器 完全破解+使用教程 Red Gate系列文章: Red Gate系列之一 SQL Compare 10.2.0.1337 Edition 数据库比较工具 完全破解+使用教程 Red Gate系列之二 SQL Source Cont…