1、初始化ES、Kibana、Logstash

ElasticSearch、Kibana、Logstash的安装、初始化等操作这里就不赘述了，可以参考以下文章：

实现logstash6.4.3 同步mysql数据到Elasticsearch6.4.3

2、安装logstash文件导入、过滤器等插件

为了能导入文件，需要先给logstash安装几个文件导入所需的插件、过滤器等

在logstash的bin目录打开CMD窗口（win7系统可以在当前目录通过shift+右键，选择在此处打开命令窗口）,然后输入：

logstash-plugin install logstash-input-file

logstash-plugin install logstash-filter-csv

logstash-plugin install logstash-filter-date

3、配置logstash.conf

logstash.conf配置文件的内容如下;

input {

  file {

    path => ["H:/ElasticSearch/6.4.3/logstash-6.4.3/test/student.csv"]

	# 设置多长时间检测文件是否修改(单位：秒)

	stat_interval => 1

	# 监听文件的起始位置，默认是end

	start_position => beginning

	# 监听文件读取信息记录的位置

	sincedb_path => "H:/ElasticSearch/6.4.3/logstash-6.4.3/test/since_db.txt"

	# 设置多长时间会写入读取的位置信息(单位：秒)

	sincedb_write_interval => 5

    	codec => plain{

		charset=>"GBK"

		}

	}

}

filter {

	#去除每行记录中需要过滤的\N，替换为空字符串

	mutate{

		gsub => [ "message", "\\N", "" ]

	}

	# 日期格式化

	date{

		match => ["create_time", "yyyy-MM-dd HH:mm:ss"]

		locale => "cn"

	}

	csv {

		# 每行记录的字段之间以|分隔

		separator => "|"

		columns => ["id","name","department","nickname","create_time","story"]

		# 过滤掉默认加上的字段

		remove_field => ["host", "tags", "path", "message"]

	}

}

output {

    elasticsearch {

        hosts => ["192.168.1.212:9210","192.168.1.212:9211","192.168.1.212:9212"]

        index => "student"

		manage_template => true

		template => "H:/ElasticSearch/6.4.3/logstash-6.4.3/config/logstash-template.json"

		template_overwrite => true

		template_name => "student"

    }

	stdout{

		codec => json_lines

	}

}

上面的conf文件中有引用自定义的mapping模板，为啥要这么做呢？我们这里需要定制自己的字段映射模板，否则会直接用默认的logstash的模板，不一定适合我们的需求，比如不是所有字段都需要全文检索，比如日期create_time需要是date类型等，我们可以自己定义个json格式的模板在导入csv的时候指定这个模板文件路径即可。例如我们定义自己的mapping模板logstash-template.json内容如下：

这里有个坑，开始没有设置order值，默认是0，不起作用，改为大于0就可以了，这里配置成了100

{

	"order": 100,

	"version": 6100,

	"index_patterns": ["student*"],

	"settings": {

		"index.number_of_shards": 5,

		"number_of_replicas": 1,

		"index.refresh_interval": "10s"

	},

    	"mappings": {

	 "doc": {

	  "properties": {

		"@timestamp": {

		  "type": "date"

		},

		"@version": {

		  "type": "text",

		  "fields": {

			"keyword": {

			  "type": "keyword",

			  "ignore_above": 256

			}

		  }

		},

		"create_time": {

		  "type": "date",

          	  "format": "yyyy-MM-dd HH:mm:ss"

		},

		"department": {

		  "type": "text"

		},

		"id": {

		  "type": "text",

		  "fields": {

			"keyword": {

			  "type": "keyword",

			  "ignore_above": 256

			}

		  }

		},

		"name": {

		  "type": "text",

		  "fields": {

			"keyword": {

			  "type": "keyword",

			  "ignore_above": 256

			}

		  }

		},

		"nickname": {

		  "type": "text",

		  "fields": {

			"keyword": {

			  "type": "keyword",

			  "ignore_above": 256

			}

		  }

		}

	  }

	}

  }

}

4、导入csv数据

然后我们在logstash的bin目录启动cmd窗口，输入以下命令执行导入数据（-f 表示需要使用自定义的配置文件，后面带自定义配置文件路径）：

logstash.bat -f ../config/logstash.conf

注意：如果前面指定的记录上次读取文件位置信息的文件存在，请删掉（不删除的话不会重新开始导入，只会增量导入），比如删掉我们前面的logstash.conf配置文件指定了这个记录的文件：sincedb_path => "H:/ElasticSearch/6.4.3/logstash-6.4.3/test/since_db.txt"

结果如下：

然后我们通过kibana查看下导入的数据：

再查看下我们自定义的studen这个mapping模板是否安装到elasticsearch的模板库了，以及它的具体内容是啥：

从上图可以看到确实把我们自定义的mapping模板保存到ES了，并且其中的内容就是我们自定义的，比如create_date 这个字段的格式format就是我们在模板json文件中定义的。

5、本文相关文件下载

本文相关的配置文件、csv数据源

点我去下载

Logstash 6.4.3 导入 csv 数据到 ElasticSearch 6.4.3的更多相关文章

mysql导出csv/excel文件的几种方法,mysql的load导入csv数据
方法一 php教程用mysql的命令和shell select * into outfile './bestlovesky.xls' from bestlovesky where 1 order by ...
mysql SQLyog导入csv数据失败怎么办？
分享下mysql使用SQLyog导入csv数据失败的解决方法给mysql导入数据,选中某个表选择导入--导入使用本地csv数据即可,单有的时候不知道什么问题导入不成功!!! 给mysql导入数据,使 ...
jmeter 导入csv数据中json格式数据取值不完整
1.jmeter中添加csv数据文件时,数据是json格式 2.jmeter中执行取值发现只取了一部分分析原因,json格式数据,中间有逗号,而csv是根据逗号来分割的,这回导致我们取值错位. 解决 ...
MySQL 导入CSV数据
第一步创建表结构 create table t1( key1 ), v1 ) ); 第二步导入数据 load data local infile 'D:/t1.csv' into table t1 ...
mysql 导入CSV数据 [转]
转自: http://blog.chinaunix.net/uid-23284114-id-3196638.html MYSQL LOAD DATA INFILE命令可以把csv平面文件中的数据导 ...
Mysql 导入CSV数据语句导入时出现乱码的解决方案
1. 登陆mysql 2. use testdb 3. 执行导入语句 LOAD DATA LOCAL INFILE 'd://exportedtest2.csv' INTO TABLE usertab ...
sql server 小技巧(1) 导入csv数据到sql server
1. 右击 DataBaseName,选择 Tasks->Import Data 2. 选择数据源: Flat File Source , 选择一个csv文件 Advance: 选择所有的列,改 ...
如何导入CSV数据（python3.6.6区别于python2 环境）
1.python2环境下 2.python3.6.6环境下如果用python2环境下的代码,在python3.6.6环境下编译会出现以下问题: 错误(1): SyntaxError:Missing ...
plsql导入csv数据,未响应,invalid identifier
问题分析: 1.确保cvs字段名与表字段名一致,不要有空格 2.cvs字段对应表字段的大写,确保表字段都是大写 3.如果字段能对应上,plsql会自动识别出来

随机推荐

学习string,stringBuffer时遇到的问题
今天学习string和stringBuffer.了解了两者的区别,然后去看java api都有啥方法.stringBuffer类有indexOf方法,于是写了下面的代码 String str = &q ...
java(12)字符串
一.字符串概述 1.1如何使用字符串 1)定义并初始化字符串 2)使用字符串,对字符串进行一些处理 1.2字符串的长度语法: 字符串1.length(); -->返回字符串1的长度 publ ...
poj2689 Prime Distance题解报告
题目戳这里 [题目大意] 给定一个区间[L,R],求区间内的质数相邻两个距离最大和最小的. [思路分析] 其实很简单呀,很明显可以看出来是数论题,有关于质数的知识. 要注意一下的就是L和R的数据范围都 ...
java程序设计习题总结
---恢复内容开始--- main()方法的参数名可以改变:main()方法的参数个数不可以改变. 当一个程序没有main()方法是,是可以编译通过的,但是不能给运行,因为找不到一个主函数入口. 标识 ...
E: Unable to locate package clang-7 E: Unable to locate package clang++-7 E: Couldn't find any package by regex 'clang++-7'
我的系统是Debian 9.8, 然后在装下面这两个包的时候老是提示找不到.然后再github上一问,过了几分钟就有大佬回复了,而且亲测有效 ~$ sudo apt-get -y install cl ...
spring security 学习笔记
官方文档
Sql server2012转sql server2008步骤经验总结（转）
wIndows用户登入选择“数据库”右键选择“附加”点击“添加” 打开数据库,右键选中选择“任务”→“生成脚本”→“选择对象”→“编写整个数据及所有数据库对象的脚本” →“下一步” “设置脚本编写选 ...
ABP代码生成器与升级到VS2017VSIX
首先,我不是要分享一个代码生成器,而是怎么升级到VS2017,简单介绍下如何将2015的VSIX项目升级到2017 阳光铭睿写了一篇<分享一个与ABP配套使用的代码生成器源码>,并在群 ...
Option path is not valid. Please refer to the README.
使用pomelo创建的项目并且安装依赖项目之后启动项目如出现如下错误提示 [2018-12-18 11:23:16.161] [ERROR] console - Option path is not ...
Python base64编码，转图片
我在做火车票抢票器的时候遇到一个问题,就是验证码提取的:一般验证码都是一些http请求的url,但是火车票网站遇到了我没有见过的以data:image/jpg;base64开头的字符串.现在我们就用P ...

Logstash 6.4.3 导入 csv 数据到 ElasticSearch 6.4.3

本文目录：

1、初始化ES、Kibana、Logstash

2、安装logstash文件导入、过滤器等插件

3、配置logstash.conf

4、导入csv数据

5、本文相关文件下载

Logstash 6.4.3 导入 csv 数据到 ElasticSearch 6.4.3的更多相关文章

随机推荐

热门专题