solr系统query检索词特殊字符的处理

solr是基于 lucence开发的应用，如果query中带有非法字符串，结果很可能是检索出所有内容或者直接报错，所以你对用户的输入必须要先做处理。输入星号，能够检索出所有内容；输入加号，则会报错。

官方的处理办法（java，因为solr是java开发的）：

https://svn.apache.org/repos/asf/lucene/dev/trunk/solr/solrj/src/java/org/apache/solr/client/solrj/util/ClientUtils.java
public static String escapeQueryChars(String s) {
StringBuilder sb = new StringBuilder();
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
// These characters are part of the query syntax and must be escaped
if (c == '\\' || c == '+' || c == '-' || c == '!' || c == '(' || c == ')' || c == ':'
|| c == '^' || c == '[' || c == ']' || c == '\"' || c == '{' || c == '}' || c == '~'
|| c == '*' || c == '?' || c == '|' || c == '&' || c == ';' || c == '/'
|| Character.isWhitespace(c)) {
sb.append('\\');
}
sb.append(c);
}
return sb.toString();
}

翻译的php版本（利用preg_replace函数进行正则替换）：

static public function escape($value)
{
//list taken from http://lucene.apache.org/java/docs/queryparsersyntax.html#Escaping%20Special%20Characters
$pattern = '/(\+|-|&|\||!|$|$|\{|}|\[|]|\^|"|~|\*|\?|:|;|~|\/)/';
$replace = '\\\$1';
return preg_replace($pattern, $replace, $value);
}

翻译后的python版本：

import re
def escape_solr(word):
return re.sub('(\\\|\+|-|&|\|\||!|$|$|\{|}|\[|]|\^|"|~|\*|\?|:|;|/|\~)','\\\1', word )

C#版

    /// <summary>

    /// solr查询字符串特殊字符转义

    /// </summary>

    /// <param name="s"></param>

    /// <returns></returns>

    public static String escapeQueryChars(String s)

    {

        StringBuilder sb = new StringBuilder();

        var ss = s.ToCharArray();

        foreach (var c in ss)

        {

            // These characters are part of the query syntax and must be escaped

            if (c == '\\' || c == '+' || c == '-' || c == '!' || c == '(' || c == ')' || c == ':'

              || c == '^' || c == '[' || c == ']' || c == '\"' || c == '{' || c == '}' || c == '~'

              || c == '*' || c == '?' || c == '|' || c == '&' || c == ';' || c == '/'

              )

            {

                sb.Append('\\');

            }

            sb.Append(c);

        }

        return sb.ToString();

    }

solr系统query检索词特殊字符的处理的更多相关文章

[转]solr系统query检索词特殊字符的处理
原文地址:http://blog.csdn.net/wgw335363240/article/details/39889979 solr是基于 lucence开发的应用,如果query中带有非法字符串 ...
我的solr学习笔记--solr admin 页面检索调试
前言 Solr/Lucene是一个全文检索引擎,全文引擎和SQL引擎所不同的是强调部分相关度高的内容返回,而不是所有内容返回,所以部分内容包含在索引库中却无法命中是正常现象. 多数情况下我们 ...
【大数据技术】HBase与Solr系统架构设计
如何在保证存储量的情况下,又能保证数据的检索速度. HBase提供了完善的海量数据存储机制,Solr.SolrCloud提供了一整套的数据检索方案. 使用HBase搭建结构数据存储云,用来存储海量数据 ...
Solr DIH query 工作流
本文地址 http://www.cnblogs.com/jasonxuli/p/6491270.html DataImportHandler (DIH) 支持全量数据导入和增量数据导入,主要有四个qu ...
solr如何让全词匹配结果在最前面
在全文搜索中默认排序是按照匹配度权值score排序的,权值越大位置越靠前,那为什么有很多时候全词匹配反而不在最前面那,其实很简单因为全词匹配权值也就是100,但是还有很多权值大于100的排在了前面. ...
Solr查询query效果对比
q条件默认分词(org.apache.solr.analysis.TokenizerChain) "parsedquery" IK分词(org.wltea.analyzer.lu ...
[Spring cloud 一步步实现广告系统] 8. 检索系统配置&依赖
工作流程项目依赖 <dependencies>  <dependency> <groupId>org.spr ...
DIH增量、定时导入并检索数据--转载
原文地址:http://www.ifunit.com/984/solr%E5%AD%A6%E4%B9%A0%EF%BC%88%E4%BA%94%EF%BC%89dih%E5%A2%9E%E9%87%8 ...
soso官方：基于相关排序的判断
http://www.wocaoseo.com/thread-186-1-1.html 议程概述检索词用户的信息需求网页的自有信息网页的附属信息相关性的计算框架概述相关性的表象检索词 ...

随机推荐

说明os,sys模块不同?并列举常用的模块方法
官方解释: os: This module provides a portable way of usingoperating system dependent functionality. 翻译:提 ...
分页-jquery.page.js插件在使用时重复触发“上一页”和“下一页”操作
HTML代码 <!-- <div class="zxf_pagediv" id="Pagination" style="display:b ...
ArrayBlcokingQueue，LinkedBlockingQueue与Disruptor三种队列对比与分析
一.基本介绍 ArrayBlcokingQueue,LinkedBlockingQueue是jdk中内置的阻塞队列,网上对它们的分析已经很多,主要有以下几点: 1.底层实现机制不同,ArrayBlco ...
代码编辑器之notepad++
引用及下载地址:http://www.iplaysoft.com/notepad-plus.html NotePad++ 优秀的支持语法高亮的开源免费编辑器绿色版下载 EditPlus,它始终是一款收 ...
excel技巧--批量生成工资条
要想生成如上图的工资条,快速的方法如下: 1.在工资表右侧建立一升序数字列,完成后再复制该列,重复粘贴一次在该列底部.2.对该表排序:“开始”-->“排序和筛选”-->自定义排序.在对话框 ...
[1] 注解（Annotation）-- 深入理解Java：注解（Annotation）基本概念
转载 http://www.cnblogs.com/peida/archive/2013/04/23/3036035.html 深入理解Java:注解(Annotation)基本概念什么是注解(An ...
Azure 认知服务 (3) 计算机视觉API - 分析图像，使用C#代码
<Windows Azure Platform 系列文章目录> 在上一节中Azure 认知服务 (2) 计算机视觉API - 分析图像,笔者介绍了如何使用API测试控制台进行调试. 本章将 ...
Git常见使用方法
图参考:http://www.ruanyifeng.com/blog/2014/06/git_remote.html 1.GitLab配置 git config --global user.name ...
简单说throw和throws的区别
1. 区别 throws是用来声明一个方法可能抛出的所有异常信息,throws是将异常声明但是不处理,而是将异常往上传,谁调用我就交给谁处理.而throw则是指抛出的一个具体的异常类型. 2.分别介绍 ...
win7下python2.6如何安装setuptools和pip
1. 下载 setuptools-0.6c9.tar.gz 下载地址:http://pypi.python.org/packages/source/s/setuptools/setuptools-0. ...

solr系统query检索词特殊字符的处理

solr系统query检索词特殊字符的处理的更多相关文章

随机推荐

热门专题