ES 27 - Elasticsearch脚本的使用实践
本文以 ES 6.6.0 版本为例进行演示.
1 关于脚本
ES提供了脚本支持 —— 可以通过Groovy外置脚本(已过时)、内置painless
脚本实现各种复杂操作.
—— painless有轻便之意, 使用时直接在语法中调用即可, 无需外置, 也就是不支持通过外部文件存储painless脚本并调用的方法.
// 向ES中插入一条数据:
PUT employee/developer/1
{
"name": "shou feng",
"age": 20,
"salary": 10000
}
// 通过GET发送脚本, 允许为每个匹配的文档返回脚本评估(script evaluation)内容:
GET employee/_search
{
"script_fields": {
"change_age_field": { // 该字段不存在 - script fields可以处理未存储的字段
"script": {
"lang": "expression",
"source": "doc['age'] * multiplier", // 获取age字段的值进行计算
"params": {
"multiplier": 2
}
}
}
}
}
// 响应结果为:
{
"took" : 1,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : 1,
"max_score" : 1.0,
"hits" : [
{
"_index" : "employee",
"_type" : "developer",
"_id" : "1",
"_score" : 1.0,
"fields" : {
"change_age_field" : [
40.0
]
}
}
]
}
}
2 脚本使用的最佳实践
Elasticsearch第一次加载一个新脚本时, 会将新脚本编译并存储在缓存中.
编译可能是一个繁重的过程, 如果需要将变量传递给脚本, 建议: 将它们作为命名参数传递给脚本本身(方式①), 而不是硬编码在脚本中(方式②).
(1) 方式① 参数传递:
"source": "doc['age'] * multiplier",
"params": {
"multiplier": 2
}
(2) 方式② 硬编码:
"source": "doc['age'] * 2"
(3) 优劣对比:
每次乘数改变时都必须重新编译第②个版本, 而第①个版本只编译一次.
如果短时间内编译过多的脚本, ES将拒绝带有
circuit_breaking_exception
错误的新脚本.Elasticsearch默认情况下, 每分钟最多编译15个内联脚本, 可以通过修改
script.max_compilations_rate
的值来更改此设置.
2.1 创建脚本并存储
可以使用_scripts
API 将脚本存储在集群状态中, 并从集群状态中检索脚本.
使用_scripts/{id}
的方式操作脚本, 具体步骤如下:
(1) 首先在集群状态中创建名为calculate-score的脚本:
POST _scripts/calculate-score
{
"script": {
"lang": "painless",
"source": "Math.log(_score * 2) + params.my_modifier"
}
}
(2) 检索存储的脚本:
GET _scripts/calculate-score
(3) 通过脚本id使用已创建的脚本:
GET _search
{
"query": {
"script": {
"script": {
"id": "calculate-score",
"params": {
"my_modifier": 2 // 传递脚本所需的参数
}
}
}
}
}
(4) 删除脚本:
DELETE _scripts/calculate-score
2.2 脚本的缓存
默认情况下, 所有的脚本都会被缓存到ES集群中, 因此只有当脚本被更新之后, ES才会重新编译它们.
同样, 脚本没有过期时间的说法, 但可以使用script.cache.expire
设置更改过期时间.
也可以使用script.cache.max_size
配置此脚本缓存的大小, 默认缓存大小为100.
存储脚本的大小限制为65535字节, 可以通过 script.max_size_in_bytes
来更改, 但是如果脚本非常大, 就应该考虑相关脚本的实现引擎是否足够优秀.
2.3 Script Field - 脚本字段
脚本字段还可以通过访问_source
字段来提取文档的其他字段 —— 使用params ['_source']
提取要从中获取的内容.
比如访问
_source
元字段中message
字段的内容, 可以用:"script": "params['_source']['message']"
访问.
另外: 理解doc['my_field'].value
和params['_source']['my_field']
之间的区别非常重要:
① 使用doc关键字: 将导致该字段的术语加载到内存(缓存)中, 这样脚本的执行速度会更快, 但也会带来更多的内存消耗. 另外,
doc […]
符号只允许简单的值字段(不能从中返回JSON对象), 并且它只对非分析或基于单个术语的字段有意义.② 使用params关键字: 每次使用时都必须加载和解析
_source
, 这是非常缓慢的.建议: 使用
doc
关键字, 从文档中访问相关字段的值, 这种方式更加高效.
参考资料
版权声明
出处: 博客园 马瘦风的博客(https://www.cnblogs.com/shoufeng)
感谢阅读, 如果文章有帮助或启发到你, 点个[好文要顶
ES 27 - Elasticsearch脚本的使用实践的更多相关文章
- ES 13 - Elasticsearch的元字段 (_index、_type、_source、_routing等)
目录 1 标识元字段 1.1 _index - 文档所属的索引 1.2 _uid - 包含_type和_id的复合字段 1.3 _type - 文档的类型 1.4 _id - 文档的id 2 文档来源 ...
- ES 07 - Elasticsearch查询文档的六种方法
目录 1 Query String Search(查询串检索) 2 Query DSL(ES特定语法检索) 3 Query Filter(过滤检索) 4 Full Text Search(全文检索) ...
- Linux(centos)安装es(elasticsearch)
前提条件--需要安装jdk环境,不同版本的es所对应的jdk版本要求不同,es6的使用jdk1.8可以 1.下载elasticsearch压缩包 下载地址:https://www.elastic.co ...
- 编写Shell脚本的最佳实践
编写Shell脚本的最佳实践 http://kb.cnblogs.com/page/574767/ 需要记住的 代码有注释 #!/bin/bash # Written by steven # Name ...
- ES 21 - Elasticsearch的高级检索语法 (包括term、prefix、wildcard、fuzzy、boost等)
目录 1 term query - 索引词检索 1.1 term query - 不分词检索 1.2 terms query - in检索 2 prefix query - 前缀检索 3 wildca ...
- ES 32 - Elasticsearch 数据建模的探索与实践
目录 1 什么是数据建模? 2 如何对 ES 中的数据进行建模 2.1 字段类型的建模方案 2.2 检索.聚合及排序的建模方案 2.3 额外存储的建模方案 3 ES 数据建模实例演示 3.1 动态创建 ...
- Elasticsearch 最佳运维实践 - 总结(一)
对于Elasticsearch的学习,需要清楚的明白它的每个核心概念,由浅入深的了解,才能更好的掌握这门技术.下面先简单罗列下Elasticsearch的核心概念: 一.Elasticsearch数据 ...
- Elasticsearch索引容量管理实践【>>戳文章免费体验Elasticsearch服务30天】
[活动]Elasticsearch Service免费体验馆>> Elasticsearch Service自建迁移特惠政策>>Elasticsearch Service新用户 ...
- ES 15 - Elasticsearch中的数据类型 (text、keyword、date、geo等)
目录 1 核心数据类型 1.1 字符串类型 - string(不再支持) 1.1.1 文本类型 - text 1.1.2 关键字类型 - keyword 1.2 数字类型 - 8种 1.3 日期类型 ...
随机推荐
- 百度云下载神器 速盘SpeedPan v1.9.7
速盘 – 不一样的度盘神器!SpeedPan 是一款由吾爱破解论坛会员"菩提叶"制作的度盘满速下载工具.这款百度网盘高速下载工具,免费小巧简单易用,采用了Aria2多线程下载,支持 ...
- [Noi2002]Savage 题解
[Noi2002]Savage 时间限制: 5 Sec 内存限制: 64 MB 题目描述 输入 第1行为一个整数N(1<=N<=15),即野人的数目. 第2行到第N+1每行为三个整数Ci ...
- 学习使用Quartz,java
报名立减200元.暑假直降6888. 邀请链接:http://www.jnshu.com/login/1/20535344 邀请码:20535344 Quartz官网 添加quartz到Java应用中 ...
- 《ElasticSearch6.x实战教程》之准备工作、基本术语
第一章-准备工作 工欲善其事必先利其器 ElasticSearch安装 ElasticSearch6.3.2下载地址(Linux.mac OS.Windows通用,下载zip包即可):https:// ...
- 深入了解数据校验:Bean Validation 2.0(JSR380)
每篇一句 > 吾皇一日不退役,尔等都是臣子 对Spring感兴趣可扫码加入wx群:`Java高工.架构师3群`(文末有二维码) 前言 前几篇文章在讲Spring的数据绑定的时候,多次提到过数据校 ...
- 利用百度AI OCR图片识别,Java实现PDF中的图片转换成文字
序言:我们在读一些PDF版书籍的时候,如果PDF中不是图片,做起读书笔记的还好:如果PDF中的是图片的话,根本无法编辑,做起笔记来,还是很痛苦的.我是遇到过了.我们搞技术的,当然得自己学着解决现在的痛 ...
- C#4.0新增功能04 嵌入的互操作类型
连载目录 [已更新最新开发文章,点击查看详细] 从 .NET Framework 4 开始,公共语言运行时支持将 COM 类型的类型信息直接嵌入到托管程序集中,而不要求托管程序集从互操作程序集中 ...
- C#3.0新增功能09 LINQ 基础05 使用 LINQ 进行数据转换
连载目录 [已更新最新开发文章,点击查看详细] 语言集成查询 (LINQ) 不只是检索数据. 它也是用于转换数据的强大工具. 通过使用 LINQ查询,可以使用源序列作为输入,并通过多种方式对其进 ...
- .net持续集成sonarqube篇之sonarqube基本操作(一)
系列目录 Sonarqube Web管理界面虽然设计的简洁大方,也非常直观,但是由于功能繁多,这对快速入手以及快速定位到想要的功能都是一个挑战,在以后的几个小节里我们简要介绍. OwerView(概览 ...
- mysql之char、varchar、text对比
mysql5.0.3以后,n都表示字符数(varchar(n)) 检索效率 char > varchar > text 当varchar长度超过255之后,跟text一致,但是设置varc ...