elasticsearch 自定义similarity 插件开发

转自:http://www.chepoo.com/elasticsearch-similarity-custom-plug-in-development.html

在搜索开发中，我们要修改打分机制，就需要自定义similarity。现在来简单说一下elasticsearch下的自定义similarity 插件开发。

网上的https://github.com/tlrx/elasticsearch-custom-similarity-provider仅仅支持0.20.0.Beta1-SNAPSHOT版本，现在我们用的版本是elasticsearch 0.90版本以上。那个例子现在不能用，我修改了一下。

1.继承DefaultSimilarity，实现自己的搜索打分机制。

package org.elasticsearch.index.similarity;

import org.apache.lucene.search.similarities.DefaultSimilarity;

/**

 * Custom similarity class

 *

 * @author xq

 *

 */

public class CustomSimilarity extends DefaultSimilarity {

	@Override

	public float idf(long docFreq, long numDocs) {

		return 1.0f;

	}

}

2.继续AbstractSimilarityProvider，把自定义的打分机制类加载到elasticsearch中。

package org.elasticsearch.index.similarity;

import org.elasticsearch.common.inject.Inject;

import org.elasticsearch.common.inject.assistedinject.Assisted;

import org.elasticsearch.common.settings.Settings;

/**

 * Simple {@link SimilarityProvider} for a {@link CustomSimilarity}

 *

 * @author xq

 *

 */

public class CustomSimilarityProvider extends AbstractSimilarityProvider {

	private CustomSimilarity similarity;

	@Inject

	public CustomSimilarityProvider(@Assisted String name, @Assisted Settings settings) {

		super(name);

		this.similarity = new CustomSimilarity();

	}

	public CustomSimilarity get() {

		return similarity;

	}

}

3.继承AbstractPlugin作为elasticsearch插件使用

public class CustomerSimilarityPlugin extends AbstractPlugin {

    @Override public String name() {

        return "customer-similarity";

    }

    @Override public String description() {

        return "customer similarity";

    }

    @Override public void processModule(Module module) {

        if (module instanceof SimilarityModule) {

        	SimilarityModule similarityModule = (SimilarityModule) module;

        	similarityModule.addSimilarity("customer-similarity", CustomSimilarityProvider.class);

        }

    }

}

4.使用

curl -XPOST 'http://host:port/tweeter/' -d '

{

  "settings": {

    "similarity": {

      "index": {

        "type": "org.elasticsearch.index.similarity.CustomSimilarityProvider"

      },

      "search": {

        "type": "org.elasticsearch.index.similarity.CustomSimilarityProvider"

      }

    }

  }

}'

在创建mapping的使用自定义的打分规则：

{

  "news" : {

    "properties" : {

      "title" : { "type" : "string", "similarity" : "my_similarity" }

    }

}

在elasticsearch.yml中配置自定义的打分规则类为默认规则。 index.similarity.default.type: my_similarity

相关程序已经放在https://github.com/awnuxkjy/es-custom-similarity-provider,有兴趣的朋友可以参考一下。

把程序打成jar包放在elasticsearch 的plugins 下的 similarity 目录下即可 参考文章： http://www.elasticsearch.org/guide/reference/index-modules/similarity/

elasticsearch 自定义similarity 插件开发的更多相关文章

elasticsearch 自定义_id
elasticsearch 自定义ID: curl -s -XPUT localhost:9200/web -d ' { "mappings": { "blog" ...
JMeter自定义采样器插件开发
JMeter自定义采样器插件开发目录 JMeter自定义采样器插件开发 1. 简介 2. 需求简介 3.成品展示成功展示失败展示 4. 准备开发环境 4.1 准备pom文件 4.2 新建Java ...
Elasticsearch 自定义多个分析器
分析器(Analyzer) Elasticsearch 无论是内置分析器还是自定义分析器,都由三部分组成:字符过滤器(Character Filters).分词器(Tokenizer).词元过滤器(T ...
Elasticsearch 自定义映射
尽管在很多情况下基本域数据类型已经够用,但你经常需要为单独域自定义映射 ,特别是字符串域.自定义映射允许你执行下面的操作: 全文字符串域和精确值字符串域的区别使用特定语言分析器优化域以适应部分匹 ...
ElasticSearch自定义分析器-集成结巴分词插件
关于结巴分词 ElasticSearch 插件: https://github.com/huaban/elasticsearch-analysis-jieba 该插件由huaban开发.支持Elast ...
Elasticsearch自定义分析器
关于分析器 ES中默认使用的是标准分析器(standard analyzer).如果需要对某个字段使用其他分析器,可以在映射中该字段下说明.例如: PUT /my_index { "mapp ...
elasticsearch自定义动态映射
https://www.elastic.co/guide/cn/elasticsearch/guide/current/custom-dynamic-mapping.html如果你想在运行时增加新的字 ...
ElasticSearch——自定义模板
output中配置 elasticsearch{ action => "index" hosts => ["xxx"] index => &q ...
ElasticSearch 自定义排序处理
使用function_score进行分组处理,利用分组函数script_score进行自定义分值处理, 注意:使用script功能需要在配置中打开脚本功能: script.inline: on s ...

随机推荐

Python开发【整理笔记】
回顾笔记学python半年,新知识不断填充,之前学的东西也忘的差不多,整理下笔记,把重点再加深下印象,算是读书拾遗吧.... 1.类继承.新式类.经典类首先,新式类.经典类的概念只存在于Pytho ...
【Loadrunner接口测试】什么情况需要区分PC和手机端去做压测？
1.PC和手机本身访问的都是接口,能有啥不一样的这个一般看不出来,除非你们开发给APP的接口定义为http://api.mobile.com之类的网站是网站,APP是APP但是不论是网站还是APP ...
DBA-常用到的动态视图分析语句
--语句1:获取前20逻辑读取次数或逻辑写入次数或CPU 时间 ), ((CASE qs.statement_end_offset THEN DATALENGTH(qt.TEXT) ELSE qs.s ...
PAT 1128 N Queens Puzzle[对角线判断]
1128 N Queens Puzzle(20 分) The "eight queens puzzle" is the problem of placing eight chess ...
mysql key index区别
看似有差不多的作用,加了Key的表与建立了Index的表,都可以进行快速的数据查询.他们之间的区别在于处于不同的层面上. Key即键值,是关系模型理论中的一部份,比如有主键(Primary Key), ...
hdu5141 线段树
这题说的是给了一串然后计算出这个串的最长递增子序列的长度,然后计算出有过少个子串[i,j] 他们的最长递增子序列和这整个子串的最长递增子序列相同,我们对于每个j最长递增子序列找出他在序列中的使成为最长 ...
一、怎样使用eclipse查看JDK源码
前言: JDK是整个java开发的核心,它包含了JAVA的运行环境,JAVA工具和JAVA基础的类库.阅读一些系统的源码会帮助你理解一些基本的原理. 一.创建一个工程在eclipse中创建一个jav ...
DB开发之postgresql
1.环境变量配置: PGLIB=/usr/local/pgsql/lib PGDATA=$HOME/data PATH=$PATH:/usr/local/pgsql/bin MANPATH=$MANP ...
imx6------watchdog导致不进系统
刚上板子,把大部分驱动都停了,不过watchdog的驱动没停,当时想没应用程序所以watchdog不用管,没想到就是watchdog卡住了,有程序open了watchdog但是没有write,结果t ...
ISSCC 2017论文导读 Session 14: A 28nm SoC with a 1.2GHz Prediction Sparse Deep-Neural-Network Engine
A 28nm SoC with a 1.2GHz 568nJ/Prediction Sparse Deep-Neural-Network Engine with >0.1 Timing Erro ...

elasticsearch 自定义similarity 插件开发

elasticsearch 自定义similarity 插件开发的更多相关文章

随机推荐

热门专题