logstash与kafka消息传输<一>
1、版本:
logstash6.1.2、kafka-0.11、kafka-0.8.2、java1.8
Note:
Logstash requires Java 8. Java 9 is not supported. Use the official Oracle distribution or an open-source distribution such as OpenJDK.
2、下载:
https://www.elastic.co/downloads/logstash(推荐下载tar包,yum源安装总提示Unable to find JRuby.)
https://kafka.apache.org/downloads
3、安装
1)kafka
#tar xf kafka_2.11-0.11.0.2.tgz
#配置使用kafka参考我的其他文章http://www.cnblogs.com/cuishuai/p/7475356.html。
2)logstash
#tar xf logstash-6.1.2.tar.gz
#cp ./logstash-6.1.2/bin/* /usr/bin
创建配置文件:
#cat etl.conf
input{
kafka{
bootstrap_servers => ["10.10.11.2:9092"]
client_id => "shence"
#auto_offset_reset => "latest"
consumer_threads => 5
#decorate_events => true
topics => ["event_topic"]
# type => "bhy"
}
}
output {
kafka {
bootstrap_servers => "10.10.8.2:9092"
codec => json
compression_type => "gzip"
topic_id => "shence"
}
}
详细配置参考:
https://www.elastic.co/guide/en/logstash/6.1/plugins-inputs-kafka.html
https://www.elastic.co/guide/en/logstash/6.1/filter-plugins.html
https://www.elastic.co/guide/en/logstash/6.1/codec-plugins.html
https://www.elastic.co/guide/en/logstash/6.1/plugins-outputs-kafka.html
https://github.com/joekiller/logstash-kafka/blob/master/README.md
4、启动logstash
#./bin/logstash -f etl.conf
这种启动方式是前端启动关掉终端程序就退出了。可以使用nohup启动:
# nohup ./bin/logstash -f etl.conf 2>&1 &
5、检查
1)output端的kafka查看消息:
#./kafka-console-consumer.sh --zookeeper localhost:2181 --topic shence
2)output端kafka查看topic
#./kafka-topics.sh --list --zookeeper localhost:2181
3) output端kafka查看topic shence的详细信息:
#./kafka-topics.sh --describe --zookeeper localhost:2181 --topic shence
6、报错解决
1)启动logstash的时候报错:
Unable to find JRuby.
If you are a user, this is a bug.
If you are a developer, please run 'rake bootstrap'. Running 'rake' requires the 'ruby' program be available.
解决方式:
去官网下载tar解压,使用bin下的logstash启动,就好了。
2)启动logstash后,发现没有数据进来,并有如下报错:
Error while fetching metadata with correlation id 39 : {shence=LEADER_NOT_AVAILABLE}(org.apache.kafka.clients.NetworkClient) 解决方式:
检查kafka的listen的地址:listeners = PLAINTEXT://your.host.name:9092
将your.host.name 换成服务器的ip或0.0.0.0
重启服务就好了。 我是直接重启logstash就好了
logstash与kafka消息传输<一>的更多相关文章
- kafka消息传输时的对象转字符串时所需 -json String 转list 、set、 Long、 String 、map 与json Iterator遍历
JSONObject jsonObject = new JSONObject(jsonString); Iterator iterator = jsonObject.keys(); while(ite ...
- 使用Nginx和Logstash以及kafka来实现网站日志采集的详细步骤和过程
使用Nginx和Logstash以及kafka来实现网站日志采集的详细步骤和过程 先列出来总体启动流程: (1)启动zookeeper集群(hadoop01.hadoop02和hadoop03这3台机 ...
- Kafka简介及使用PHP处理Kafka消息
Kafka简介及使用PHP处理Kafka消息 Kafka 是一种高吞吐的分布式消息系统,能够替代传统的消息队列用于解耦合数据处理,缓存未处理消息等,同时具有更高的吞吐率,支持分区.多副本.冗余,因此被 ...
- Logstash读取Kafka数据写入HDFS详解
强大的功能,丰富的插件,让logstash在数据处理的行列中出类拔萃 通常日志数据除了要入ES提供实时展示和简单统计外,还需要写入大数据集群来提供更为深入的逻辑处理,前边几篇ELK的文章介绍过利用lo ...
- 一文看懂Kafka消息格式的演变
摘要 对于一个成熟的消息中间件而言,消息格式不仅关系到功能维度的扩展,还牵涉到性能维度的优化.随着Kafka的迅猛发展,其消息格式也在不断的升级改进,从0.8.x版本开始到现在的1.1.x版本,Kaf ...
- Kafka实战:如何把Kafka消息时延秒降10倍
背景 国内某大型税务系统,业务应用分布式上云改造. 业务难题 如上图所示是模拟客户的业务网页构建的一个并发访问模型.用户在页面点击从而产生一个HTTP请求,这个请求发送到业务生产进程,就会启动一个投递 ...
- 转载来自朱小厮博客的 一文看懂Kafka消息格式的演变
转载来自朱小厮博客的 一文看懂Kafka消息格式的演变 ✎摘要 对于一个成熟的消息中间件而言,消息格式不仅关系到功能维度的扩展,还牵涉到性能维度的优化.随着Kafka的迅猛发展,其消息格式也在 ...
- MQ选型对比ActiveMQ,RabbitMQ,RocketMQ,Kafka 消息队列框架选哪个?
最近研究消息队列,发现好几个框架,搜罗一下进行对比,说一下选型说明: 1)中小型软件公司,建议选RabbitMQ.一方面,erlang语言天生具备高并发的特性,而且他的管理界面用起来十分方便.不考虑r ...
- 为什么会有kafka消息系统?小问题藏着大细节!
前言:老刘今天写这篇文章首先想对一些复制粘贴的博客表达不满:其次是想用通俗易懂的话解释消息系统:最后欢迎各位英雄好汉.女中豪杰前来battle. 1. 为什么有消息系统? 1.1 背景 今天复习kaf ...
随机推荐
- hive函数 parse_url的使用
hive提供了直接处理url的函数 parse_url desc funtion 的解释是: parse_url(url, partToExtract[, key]) - extracts a par ...
- 如何处理由Dll缺失造成的程序直接崩溃的问题。
问题描述:在开发一个上位机程序时(C#.winform),使用到了Kvaser的SDK,而这个SDK是基于对应的Kvaser驱动开发的.当前PC如果没有装Kvaser驱动, 程序启动时,会直接奔溃.调 ...
- [mysql语句] mysql 语句收集
// http://stackoverflow.com/questions/6666152/mysql-order-by-where 1. "select * from t_activity ...
- 操作Checkbox标签
在前端开发中,少不了对Checkbox的操作. 常用的的方法有2个:.is()和.prop()方法.前者是判断 checkbox的状态,选不是未选.而后者为checkbox设置一个值,可以设置chec ...
- docker容器备份、恢复和迁移volume方案
volume作为数据的载体,在很多情况下需要对其中的数据进行备份.迁移或是恢复.下面一docker容器的volume为例,说一下备份的技巧. 我们先建立一个容器vol_simple,该容器在/date ...
- flask_json数据入库Mongo
首先我们先导入python内置的json库,用来将接送数据转换为python对象 import json #导入自定义的数据公共库 from db_tool import db #载入库之前先清空数据 ...
- Vue2.5开发去哪儿网App 搜索功能完成
效果展示: Search.vue: <div class="search-content" ref="search" v-show="keywo ...
- 剑指offer十五之反转链表
一.题目 输入一个链表,反转链表后,输出链表的所有元素. 二.思路 详细分析见代码注释 三.代码 public class Solution { public ListNode Reverse ...
- rpm安装JDK方法
由于版权原因,Linux发行版并没有包含官方版的Oracle JDK,必须自己从官网上下载安装.Oracle官网用Cookie限制下载方式,使得眼下只能用浏览器进行下载,使用其他方式可能会导致下载失败 ...
- 在Storm的Toplogy中设置多数据源Spout
上代码:主要看main方法中的设置. 如下代码是一般情况下的设置方法...Trident中设置多数据源看对应的博客总结 /** * 指定多个数据源 * 数字累加求和 * 先添加storm依赖 */ ...