中文模糊搜索 - chunyu

什么是模糊搜索?为什么要使用模糊搜索?相信大家都知道这些,我就不讲了.今天只讲怎么使用模糊搜索. 一 LIKE.大名鼎鼎的like字句,使用方便,兼容性好,易维护,但效率奇低.大家都会用,不多介绍. 二 MYSQL 原生支持的全文索引(FULLTEXT index).实现方式:首先给目标字段添加索引,索引的类型是FULLTEXT,然后查询的时候,在sql语句的where条件后面使用against()去指定关键字就好了.而网上很多文章对这个理解却有很多误区,认为FULLTEXT不支持中文,或者Li…

ios中文模糊搜索兼容问题

$(function(){ var cpLock = true; $("input[name='name']").off().on({ compositionstart: function () {//中文输入开始 cpLock = false; }, compositionend: function () {//中文输入结束 cpLock = true; }, input: function () {//非中文输入结束 if (cpLock){ console.log(3); } }…

EasyUI combobox

高度自适应 data-options="required:true,editable:false,panelHeight:'auto',panelMaxHeight:170" 加上panelHeight:'auto'即可取值问题例子:<select id="cc" class="easyui-combobox" name="cc" >在对其取值的时候? //不能使用 $('#cc').val() //正确应该…

Oracle系列——开发中奇葩问题你遇到几个（一）

前言:在使用oracle数据进行开发的时候有没有经常出现一些很奇怪.很纳闷.很无厘头的问题呢.下面是本人使用oracle一段时间遇到的问题小节,在此做个记录,方便以后再遇到类似的问题能快速解决.如果你是数据库大虾或者连续使用oracle数据库1年以上,这篇文章可以不用看了,此文请直接略过:如果你是数据库小菜或者刚从sql server转到使用oracle开发,这些问题可能你曾经遇到或者即将遇到,不信?走着瞧! 1.oracle插入数据中文乱码的问题: 问题描述:在plsql中不管是编辑数据,还是…

mysql百万级全文索引及match快速查找

建立全文索引的表的存储引擎类型必须为MyISAM 问题是match against对中文模糊搜索支持不是太好新建一个utf8 MyISAM类型的表并建立一个全文索引 : CREATE TABLE articles ( id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY, title VARCHAR(200), body TEXT, FULLTEXT (title,body) ) ENGINE=MyISAM DEFAULT > 其中FU…

「神器」快速启动应用Wox

每天进步一丢丢,连接梦与想合理的的要求是锻炼不合理的要求是磨练过分的要求是锤炼今天分享一个会让你爱不释手的神器,Wox Wox 是一款国产开源免费的软件快捷启动工具,它可以快速搜索并打开你电脑上的程序.文件.或是查词翻译.网站查找等其他操作,同时还支持安装插件扩展更多功能基本操作 ALT + Space(空格键) 快速启动Wox 输入关键字,进行搜索,可使用中文模糊搜索,拼音模糊搜索输入得越准确,搜索结果越精准快速搜索文件,并打开文件夹最新版wox集成了everything…

First-blog:解决mybatis 用mysql进行模糊搜索时，查不了中文问题

如图:点击小字按搜索时,出现乱码搜索不了解决办法:出现乱码问题,一般无非两种 1.是数据库问题 2.是服务器问题我在MySQL命令行搜索时,中文可以实现,说明时服务器问题通过修改 tomcat 下 cof 文件夹里的 service文件,在 <connecter 尾端添加 URIEncoding="UTF-8"/> 问题解决…

man rsync翻译(rsync命令中文手册)

本文为命令rsync的man文档翻译,几乎所有的选项都翻译了,另外关于筛选规则部分只翻译了一部分.由于原文很多地方都比较啰嗦,所以译文中有些内容可能容易让国人疑惑,所以我个人在某些地方加上了注释.若有错误之处,盼请指出. rsync(1) rsync(1) 名称 rsync - 一个快速.多功能的远程(和本地)文件拷贝工具摘要 Local: rsync [OPTION...] SRC... [DEST] Access via remote shell: Pull: rsync [OPTIO…

使用PostgreSQL进行中文全文检索

code[class*="language-"], pre[class*="language-"] { background-color: #fdfdfd; -webkit-box-sizing: border-box; -moz-box-sizing: border-box; box-sizing: border-box; margin-bottom: 1em; } :not(pre) > code[class*="language-"]…

ThinkPHP3.2添加scws中文分词

前言前一段时间,公司网站做站内搜索,只简单针对输入的文字进行搜索,作全匹配检索,搜索出来的内容很少.如何达到模糊搜索,匹配到更多的内容成了需要解决的问题.于是,今天想到可以做分词检索,如何对输入的一段文字进行分词就是关键,本着不做轮子的想法网上找找,还真有一些分词方案scws中文分词. 正文 1.引入PSCWS4文件包和XDB词典文件(utf-8),放进Vendor文件夹: 2.通过PSCWS4工具类进行分词操作: //搜索页面 public function searched($keywor…

Lucene全文检索_分词_复杂搜索_中文分词器

1 Lucene简介 Lucene是apache下的一个开源的全文检索引擎工具包. 1.1 全文检索(Full-text Search) 1.1.1 定义全文检索就是先分词创建索引,再执行搜索的过程. 分词:就是将一段文字分成一个个单词全文检索就将一段文字分成一个个单词去查询数据!!! 1.1.2 应用场景 1.1.2.1 搜索引擎(了解) 搜索引擎是一个基于全文检索.能独立运行.提供搜索服务的软件系统. 1.1.2.2 电商站内搜索(重点) 思考:电商网站内,我们都是通过输入关键词来搜索…

python中文语料分词处理，按字或者词cut_sentence

cut_sentence.py import string import jieba import jieba.posseg as psg import logging #关闭jieba日制 jieba.setLogLevel(logging.INFO) jieba.load_userdict("./corpus/keywords.txt") stopwords_path = "./corpus/stopwords.txt" stopwords = [i.strip…

win10 环境 gitbash 显示中文乱码问题处理

gitbash 是 windows 环境下非常好用的命令行终端,可以模拟一下linux下的命令如ls / mkdir 等等,如果使用过程中遇到中文显示不完整或乱码的情况,多半是因为编码问题导致的,修改文本编码即可.操作过程如下: 问题描述 gitbash 在 win10 环境下显示中文出现乱码处理办法问题是由于编码不一致造成的,修改稿界面文字编码即可. 操作 1/问题回顾 2/控制台单击右键,选择options选项 3/设置文本本地语言为 zh_CN ,编码选择 GBK, 随后单击OK保存…

网页提交中文到WEB容器的经历了些什么过程....

先准备一个网页 <html><meta http-equiv="Content-Type" content="text/html; charset=gbk" /> <title>测试编码</title> <body> <form id="form1" name="form1" method="post" action="http:/…

opencv在图像显示中文

在图像定位和模式识别时,经常需要把结果标注到图片上,标注内容可以是数字字母.矩形框等(opencv支持的)或者是中文汉字(借助freetype). 1.显示数字/矩形框 #include <opencv/highgui.h> using namespace cv; //绘画 Mat image = imread(image_root + filename); Point p1(x,y), p2(x+w,y+h), p0(x+w/, y+h/); ; //数字 rectangle(image,…

solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件

昨天已经在Tomcat容器中成功的部署了solr全文检索引擎系统的服务:今天来分享一下solr服务在海量数据的网站中是如何实现数据的检索. 在solr服务中集成IKAnalyzer中文分词器的步骤: 1.下载IKAnalyzer分词器的压缩包并解压: 2.将IKAnalyzer压缩包中的jar包复制到Tomcat容器中已经部署的solr项目中的WEB-INF/lib目录下: 3.在Tomcat容器的solr项目中的WEB-INF/目录创建一个classes目录(默认该目录是不存在的,需手动创建)…

Windows server 2012 添加中文语言包(英文转为中文)（离线）

Windows server 2012 添加中文语言包(英文转为中文)(离线) 相关资料: 公司环境:亚马孙aws虚拟机英文版Windows2012 中文SQL Server2012安装包,需要安装操作系统的中文语言包 XenSource Windows guest agent EC2 ConfigService 参考资料 http://www.cnbeta.com/articles/226755.htmhttps://technet.microsoft.com/zh-cn/library/h…

java中文乱码解决之道（一）-----认识字符集

沉寂了许久(大概有三个多月了吧),LZ"按捺不住"开始写博了! java编码中的中文问题是一个老生常谈的问题了,每次遇到中文乱码LZ要么是按照以前的经验修改,要么则是baidu.com来解决问题.阅读许多关于中文乱码的解决办法的博文后,发现对于该问题我们都(更加包括我自己)没有一个清晰明了的认识,于是LZ想通过这系列博文(估计只有几篇)来彻底分析.解决java中文乱码问题,如有错误之处望各位同仁指出!当然,此系列博文并非LZ完全原创,都是在前辈基础上总结,归纳,如果雷同纯属借鉴-- 问…

Sublime Text 3中文乱码解决方法以及安装包管理器方法

一般出现乱码是因为文本采用了GBK编码格式,Sublime Text默认不支持GBK编码. 安装包管理器简单安装使用Ctrl+`快捷键或者通过View->Show Console菜单打开命令行,粘贴如下代码: import urllib.request,os; pf = 'Package Control.sublime-package'; ipp = sublime.installed_packages_path(); urllib.request.install_opener( urlli…

MAC下 mysql不能插入中文和中文乱码的问题总结

MAC下 mysql不能插入中文和中文乱码的问题总结前言本文中所提到的问题解决方案,都是基于mac环境下的,但其他环境,比如windows应该也适用. 问题描述本文解决下边两个问题: 往mysql插入中文,能够成功,但mysql显示乱码不能往mysql插入中文,插入英文或数字能够成功其实,问题的根源还是文件或内容间使用了不同的编码方式造成的.首先查看当前使用的浏览器默认的编码方式是什么? 可以看出,这个网页的编码为中文gbk,再看简书的网页: 可以看出,大部分的网站都是utf8编码的.…

【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇一：WPF常用知识以及本项目设计总结

篇一:WPF常用知识以及本项目设计总结:http://www.cnblogs.com/baiboy/p/wpf.html 篇二:基于OneNote难点突破和批量识别:http://www.cnblogs.com/baiboy/p/wpf1.html 篇三:批量处理后的txt文件入库处理:http://www.cnblogs.com/baiboy/p/wpf2.html 篇四:关于OneNote入库处理以及审核:http://www.cnblogs.com/baiboy/p/wpf3.html […

【HanLP】HanLP中文自然语言处理工具实例演练

HanLP中文自然语言处理工具实例演练作者:白宁超 2016年11月25日13:45:13 摘要:HanLP是hankcs个人完成一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用.HanLP具备功能完善.性能高效.架构清晰.语料时新.可自定义的特点. 在提供丰富功能的同时,HanLP内部模块坚持低耦合.模型坚持惰性加载.服务坚持静态提供.词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的语料.笔者坚定支持开源的项目,本文初衷是使用自然语言…

如何在Elasticsearch中安装中文分词器(IK+pinyin)

如果直接使用Elasticsearch的朋友在处理中文内容的搜索时,肯定会遇到很尴尬的问题--中文词语被分成了一个一个的汉字,当用Kibana作图的时候,按照term来分组,结果一个汉字被分成了一组. 这是因为使用了Elasticsearch中默认的标准分词器,这个分词器在处理中文的时候会把中文单词切分成一个一个的汉字,因此引入中文的分词器就能解决这个问题. 本篇文章按照下面的内容进行描述: 分词器的作用安装IK 简单的测试模拟测试安装elasticsearch-analysis-piny…

ASP.Net MVC——使用 ITextSharp 完美解决HTML转PDF（中文也可以）

前言: 最近在做老师交代的一个在线写实验报告的小项目中,有这么个需求:把学生提交的实验报告(HTML形式)直接转成PDF,方便下载和打印. 以前都是直接用rdlc报表实现的,可这次牵扯到图片,并且更为重要的一点是 PDF的格式得跟学生提交的HMTL页面一样.经过网上查阅资料, 找到了ITextSharp插件. ITextSharp很强大,但是在处理HMTL中的 img标签时,src中只能是绝对路径. 解决方法我写在了另一篇文章中正文: ITextSharp就不多介绍了.项目的链接下载链接为ht…

javaScript生成二维码（支持中文，生成logo）

资料搜索选择star最多的两个第一个就是用的比较多的jquery.qrcode.js(但不支持中文,不能带logo)啦,第二个支持ie6+,支持中文,根据第二个源代码,使得,jquery.qrcode.js,支持中文. 支持中文 //qrcode.js function QR8bitByte(data) { this.mode = QRMode.MODE_8BIT_BYTE; this.data = data; } QR8bitByte.prototype = { getLength : f…

中文 iOS/Mac 开发博客列表

中文 iOS/Mac 开发博客列表博客地址 RSS地址 OneV's Den http://onevcat.com/atom.xml 一只魔法师的工坊 http://blog.ibireme.com/feed/ 破船之家 http://beyondvincent.com/atom.xml NSHipster http://nshipster.cn/feed.xml Limboy 无网不剩 http://feeds.feedburner.com/lzyy 唐巧的技术博客 http://blog.…

vim安装中文帮助手册

安装方法: 在下面的网站下载中文帮助的文件包:$wget http://nchc.dl.sourceforge.net/sourceforge/vimcdoc/vimcdoc-1.5.0.tar.gz 解包后进入文件夹,使用以下命令安装:$sudo ./vimcdoc.sh -i启动vim,输入:help,看看帮助文档是否已经便成中文了? 一些注意事项:1.vim中文文档不会覆盖原英文文档,安装后vim默认使用中文文档.若想使用英文文档,可在vim中执行以下命令: set helpl…

Firebug中调试中的js脚本中中文内容显示为乱码

Firebug中调试中的js脚本中中文内容显示为乱码设置页面 UFT-8 编码没用, 解决方法:点击 "Firebug"工具栏中的"选项"---"重置所有FireBug选项"即可正常使用…

烂泥：wiki系统confluence5.6.6安装、中文、破解及迁移

本文由ilanniweb提供友情赞助,首发于烂泥行天下想要获得更多的文章,可以关注我的微信ilanniweb confluence是一个专业的企业知识管理与协同软件,可以用于构建企业wiki.通过它可以实现团队成员之间的协作和知识共享. 网上有关confluence的教程比较多,在此我们以confluence5.6.6版本为例进行相关的实验. 一.环境准备 confluence的运行是依赖java环境的,也就是说需要安装jdk并且要是1.7以上版本,如下: java -version 除此之外…

烂泥：jira7.2安装、中文及破解

. jira的主要配置文件,存放在/opt/atlassian/jira/conf/server.xml文件中,如下: vim /opt/atlassian/jira/conf/server.xml 现在我们先关闭jira,然后把破解包里面的atlassian-extras-3.1.2.jar和mysql-connector-java-5.1.39-bin.jar两个文件复制到/opt/atlassian/jira/atlassian-jira/WEB-INF/lib/目录下. 其中atlass…

【中文模糊搜索 - chunyu】的更多相关文章