logstash的mutate过滤器的使用
logstash的mutate过滤器的使用
- 一、背景
- 二、需求
- 三、实现步骤
- 1、安装 `csv codec` 插件
- 2、准备需要读取的文件数据
- 3、编写 pipeline ,读取和输出数据
- 4、mutate 插件的使用
- 四、mutate的优先级
- 五、参考文档
一、背景
当我们使用logstash
从外部读取到数据后,默认情况下读取到的值都是string
的类型,假设我们这个时候需要修改字段值的类型,如果从string
修改成integer
,或者删除字段、修改字段的名字、给字段一个默认值等操作时,这个时候我们就可以借助 mutate
filter 来实现。
二、需求
1、从文件中读取数据,文件中的数据符合csv
的格式,即默认是以,
分隔。
2、对读取到的字段进行 删除字段、修改字段的值、修改字段的类型、给一个默认值、字段合并等操作。
三、实现步骤
1、安装 csv codec
插件
注意️:
默认情况下,csv codec
插件并没有安装,需要我们自己手动安装一下,执行如下命令bin/logstash-plugin install logstash-codec-csv
# 进入 logstash 的安装目录
cd /Users/huan/soft/elastic-stack/logstash/logstash
# 监测是否安装了 csv codec 插件
bin/logstash-plugin list --verbose
# 安装 csv 插件
bin/logstash-plugin install logstash-codec-csv
2、准备需要读取的文件数据
user_ real_name |
user_ english_name |
age | address | education | strip_blank | language | default_value | create_time |
---|---|---|---|---|---|---|---|---|
张三 | zhangSan | 20 | 湖北省;罗田县 | 学历-本科 | 去首尾空格 | java | 默认值 | 20210512 08:47:03 |
李四 | lisi | 18 | 湖北省;黄冈 | 学历-专科 | 去首 空格 | C | 20210512 03:12:20 |
3、编写 pipeline ,读取和输出数据
input {
file {
id => "mutate-id"
path => ["/Users/huan/soft/elastic-stack/logstash/logstash/pipeline.conf/filter-mutate/mutate.csv"]
start_position => "beginning"
sincedb_path => "/Users/huan/soft/elastic-stack/logstash/logstash/pipeline.conf/filter-mutate/sincedb.db"
codec => csv {
columns => ["user_real_name","user_english_name","age","address","education","strip_blank","language","default_value","create_time"]
charset => "UTF-8"
separator => ","
skip_empty_columns => false
convert => {
"age" => "integer"
}
}
}
}
output {
stdout {
codec => rubydebug {
}
}
}
csv codec
插件解释- columns :定义一组解析后的csv的列名,也是后期的字段名
- charset:字符编码
- separator:定义读取到的一行数据,以什么作为分隔,csv文件一般是以,或tab等进行分隔,默认是逗号
- skip_empty_columns:如果值为空,是否跳过空列。
- true:跳过
- false: 不跳过
- convert:数据类型转换,默认读取到的值的类型都是
string
,此处将age
字段的值的数据类型转换成了integer
4、mutate 插件的使用
前置条件:
1、如无特殊说明,测试数据的数据为 实现步骤>准备需要读取的文件数据
中的数据
注意事项:
1、update
和replace
都是更新字段的值,但是如果update
更新的字段的值不存在,那么没有效果,但是replace
会新增加这个字段。
2、copy
字段的目标值,如果存在则覆盖值,否则新增加一个字段。
1、coerce 给字段设置默认值
如果某个字段已经存在,并且它的值是null,那么我们可以使用coerce来为它设置默认值
1、配置文件的写法
filter {
mutate {
coerce => {
"default_value" => "该字段没有值,设置一个默认值"
}
}
}
2、执行结果
2、rename 给字段重命名
1、配置文件的写法
filter {
mutate {
rename => {
"user_real_name" => "[user][real_name]"
"user_english_name" => "[user][english_name]"
"age" => "年龄"
}
}
}
2、执行结果
3、update 更新字段的值
1、配置文件的写法
filter {
mutate {
# 1、更新字段的值
update => {
"user_address" => "用户的地址是: %{address}"
}
}
}
2、执行结果
3、解释
update
进行更新值,更新的字段必须要存在,否则没有任何效果。
4、replace 更新字段的值
1、配置文件的写法
filter {
mutate {
# 1、更新字段的值
replace => {
"user_address" => "用户的地址是: %{address}"
}
}
}
2、执行结果
5、convert 数据类型转换
1、可以转换的数据类型
integer、integer_eu、float、float_eu、string、boolean
2、配置文件的写法
filter {
mutate {
# 1、数据类型转换
convert => {
"age" => "string"
}
}
}
3、执行结果
6、gsub 对字段内容进行替换
1、配置文件的写法
filter {
mutate {
# 1、替换字段的内容, 第二个参数可以写正则表达式 ,替换的字段 只能是 string 类型或者 string类型的数组
gsub => [
"address", ";", "--"
]
}
}
2、执行结果
7、uppercase、capitalize、lowercase 大写、首字母大写、小写
1、配置文件的写法
filter {
mutate {
# 1.1 大写
uppercase => ["language"]
# 2.2 小写
# lowercase => ["user_english_name"]
# 3.3 首字母大写
capitalize => ["user_english_name"]
}
}
需要注意优先级。
2、执行结果
8、strip 去除首尾空格
1、配置文件的写法
filter {
mutate {
# 去除首尾空格
strip => ["strip_blank"]
}
}
2、执行结果
9、remove 移除字段
1、配置文件的写法
filter {
mutate {
# 移除字段 ,如果 Event 中 username 的值是 zhangsan ,那么会移除字段名是 foo_zhangsan 这个字段。
remove_field => ["user_real_name","foo_%{username}"]
}
}
2、执行结果
10、split 切割字段
1、配置文件的写法
filter {
mutate {
# 1、切割字段
split => {
"address" => ";"
}
}
}
2、执行结果
11、 join 连接字段
1、配置文件的写法
filter {
mutate {
# 1、切割字段
split => {
"address" => ";"
}
# 2、连接字段
join => {
"address" => "***"
}
}
}
先使用 split 切割成数组,然后使用 join 连接
2、执行结果
12、merge 字段合并
1、可以合并的情况
`array` + `string` will work
`string` + `string` will result in an 2 entry array in `dest_field`
`array` and `hash` will not work
2、配置文件的写法
filter {
mutate {
# 1、字段合并
merge => {
"user_real_name" => "user_english_name"
}
}
}
3、执行结果
13、copy 复制字段
1、配置文件的写法
filter {
mutate {
# 1、字段复制, 如果 user_name 这个字段已经存在了,那么此字段的值会被覆盖,否则新增一个字段的值
copy => {
"user_real_name" => "user_name"
}
}
}
2、执行结果
四、mutate的优先级
1、mutate 在配置文件中的执行顺序
coerce、rename、update、replace、convert、gsub、uppercase、capitalize、lowercase、strip、remove、split、join merge、copy
corece
最先执行,copy
最后执行。
2、多个mutate块的优先级
filter {
# mutate块1 会比 下方的 mutate2 先执行
mutate {}
# mutate块2
mutate {}
}
注意️:
假设 我们需要字段 age
先复制copy
一下,然后在转换一下数据类型convert
,那么可以使用上方的 多个 mutate 块
来执行。
1、配置文件的写法
filter {
# 测试多 mutate 块的优先级
mutate {
copy => {
"age" => "new_age"
}
}
mutate {
convert => {
"age" => "string"
}
}
}
将 convert 和 copy 放置在一个 mutate 块中会发现结果不一样。
2、执行结果
五、参考文档
1、https://www.elastic.co/guide/en/logstash/7.12/working-with-plugins.html
2、https://www.elastic.co/guide/en/logstash/current/plugins-codecs-csv.html
3、https://www.elastic.co/guide/en/logstash/current/plugins-filters-mutate.html
logstash的mutate过滤器的使用的更多相关文章
- Elastic Stack之Logstash进阶
Elastic Stack之Logstash进阶 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.使用GeoLite2和logstash 过滤插件的geoip案例 1>. ...
- Logstash 算术运算操作
需求:input为json,output为ES,需使用filter提取json中的某个字段,并执行加法.加法.乘法等算法操作 思路:mutate过滤器+ruby过滤器实现 避坑:根据ES及Logsta ...
- Logstash的filter插件介绍
一 官网说明 过滤器插件对事件执行中介处理.通常根据事件的特征有条件地应用过滤器. 以下过滤器插件在下面可用. Plugin Description Github repository aggrega ...
- ELK学习实验012:Logstash的安装和使用
一 logstash安装 1.1下载包 [root@node1 ~]# cd /usr/local/src/ [root@node1 src]# wget https://artifacts.elas ...
- logstash multiline
filter { multiline { pattern => "^\s+%{TIMESTAMP_ISO8601}" negate=>true what=>&qu ...
- ElastAlert监控日志告警Web攻击行为
由于公司需要监控web攻击行为,而因某些原因搭不了waf,才不得不用ElastAlert进行告警,此为前提. 一.ELK安装 Elasticsearch 是一个分布式.可扩展.实时的搜索与数据分析引擎 ...
- filter-mutate过滤插件
之前的nginx日志使用grok匹配,但是后来发现nginx的日志中每个值之间都使用了分隔符"|",这下就可以使用mutate来分隔出每个字段的含义,同时还减少了运算. 描述 mu ...
- AWS上的EFK环境部署
1.准备工作及组件 本章使用自建服务以及aws服务来配置使用. 服务 版本 作用 filebeat 6.7.2→ 7.3.1 节点日志收集,只完成少量比如多行合并工作 logstash 6.4.2→7 ...
- 【7.1.1】ELK日志系统单体搭建
ELK是什么? 一般来说,为了提高服务可用性,服务器需要部署多个实例,每个实例都是负载均衡转发的后的,如果还用老办法登录服务器去tail -f xxx.log,有很大可能错误日志未出现在当前服务器中, ...
随机推荐
- 性能测试必备命令(1)- free
性能测试必备的 Linux 命令系列,可以看下面链接的文章哦 https://www.cnblogs.com/poloyy/category/1819490.html 介绍 显示系统的内存使用情况 语 ...
- Docker(42)- 镜像原理之联合文件系统
前言 学习狂神老师的 Docker 系列课程,并总结 镜像是什么 镜像是一种轻量级.可执行的独立软件保,用来打包软件运行环境和基于运行环境开发的软件 他包含运行某个软件所需的所有内容,包括代码.运行时 ...
- Spring MVC拦截器浅析
Spring MVC拦截器 重点:Spring MVC的拦截器只会拦截控制器的请求,如果是jsp.js.image.html则会放行. 什么是拦截器 运行在服务器的程序,先于Servlet或JSP之前 ...
- openswan发送状态机分析
openswan发送状态机分析 1. 函数调用关系 2. 函数说明 如果按用户空间.内核空间划分的话,此部分代码更多是运行在内核空间的. 2.1 ipsec_tunnel_init_devices() ...
- fwm环境APP菜品数据加载失败的优化操作
1)在项目的.env文件中添加如下一行: RESPONSE_CACHE_ENABLED=true 2)拷贝 laravel-worker.conf.example,将laravel字段替换为域名,并执 ...
- Excel导入保存附件和解析数据
Excel导入保存附件和解析数据 一,前端上传附件的组件 1.先给一个下载模板的按钮 // 下载Excel模板 downLoadExcel: function () { window.open(GLO ...
- Linux详细安装流程(直接看图)
准备工作:一台电脑.sentOS镜像文件. 一.首先打开虚拟机,点击文件--新建虚拟机 二.选择自定义,然后点击下一步
- SQL Server Management Studio --- SSMS语言更换
问题描述 在安装了En版后,想更换为中文版,但换了中文安装源还是英文. 解决方法 运行 SQL Server Management Studio 通过菜单选择你想要使用的语言: 中文版:"工 ...
- Java学习笔记--注解和反射
注解和反射 1. 注解 注解作用: 对程序做出解释 被其他程序读取 注解格式: @注释名,还可以添加一些参数值,例如@SuppressWarnings(value="unchecked&qu ...
- Nginx系列(6)- nginx: [error] CreateFile() "D:\nginx-1.20.1/logs/nginx.pid" failed (2: The system cannot find the file specified)
背景 修改nginx配置文件nginx.conf后,想要重启nginx使配置生效.cmd进入nginx安装目录,输入命令: nginx -s reload 报错:nginx: [error] Crea ...