Logstash学习之路（五）使用Logstash抽取mysql数据到kakfa

一、Logstash对接kafka测通

说明：

　　由于我这里kafka是伪分布式，且kafka在伪分布式下，已经集成了zookeeper。

1、先将zk启动，如果是在伪分布式下，kafka已经集成了zk

[root@master zookeeperData]# nohup /mnt/kafka/bin/zookeeper-server-start.sh /mnt/kafka/config/zookeeper.properties &

2、启动broker

[root@master mnt]# nohup /mnt/kafka/bin/kafka-server-start.sh /mnt/kafka/config/server.properties &

3、创建topic

[root@master bin]# ./kafka-topics.sh --create --zookeeper 192.168.200.100:2181 --topic test --partition 1 --replication-factor 1

Created topic "test".

4、创建消费者

[root@master bin]# ./kafka-console-consumer.sh  --topic test --zookeeper localhost:2181

5、配置Logstash对接kafka的配置文件

input{

    stdin{}

}

output{

    kafka{

        topic_id => "test"

        bootstrap_servers => "192.168.200.100:9092" # kafka的地址

       # batch_size => 5

    }

    stdout{

        codec => rubydebug

    }

}

6、测试

启动日志：

[root@master bin]# ./logstash -f kafka.conf

Sending Logstash's logs to /mnt/logstash/logs which is now configured via log4j2.properties

[2019-04-25T16:19:38,811][WARN ][logstash.config.source.multilocal] Ignoring the 'pipelines.yml' file because modules or command line options are specified

[2019-04-25T16:19:40,075][INFO ][logstash.runner          ] Starting Logstash {"logstash.version"=>"6.3.1"}

[2019-04-25T16:19:46,274][INFO ][logstash.pipeline        ] Starting pipeline {:pipeline_id=>"main", "pipeline.workers"=>2, "pipeline.batch.size"=>125, "pipeline.batch.delay"=>50}

[2019-04-25T16:19:46,583][INFO ][org.apache.kafka.clients.producer.ProducerConfig] ProducerConfig values:

        acks = 1

        batch.size = 16384

        bootstrap.servers = [192.168.200.100:9092]

        buffer.memory = 33554432

        client.id =

        compression.type = none

        connections.max.idle.ms = 540000

        enable.idempotence = false

        interceptor.classes = []

        key.serializer = class org.apache.kafka.common.serialization.StringSerializer

        linger.ms = 0

        max.block.ms = 60000

        max.in.flight.requests.per.connection = 5

        max.request.size = 1048576

        metadata.max.age.ms = 300000

        metric.reporters = []

        metrics.num.samples = 2

        metrics.recording.level = INFO

        metrics.sample.window.ms = 30000

        partitioner.class = class org.apache.kafka.clients.producer.internals.DefaultPartitioner

        receive.buffer.bytes = 32768

        reconnect.backoff.max.ms = 10

        reconnect.backoff.ms = 10

        request.timeout.ms = 30000

        retries = 0

        retry.backoff.ms = 100

        sasl.jaas.config = null

        sasl.kerberos.kinit.cmd = /usr/bin/kinit

        sasl.kerberos.min.time.before.relogin = 60000

        sasl.kerberos.service.name = null

        sasl.kerberos.ticket.renew.jitter = 0.05

        sasl.kerberos.ticket.renew.window.factor = 0.8

        sasl.mechanism = GSSAPI

        security.protocol = PLAINTEXT

        send.buffer.bytes = 131072

        ssl.cipher.suites = null

        ssl.enabled.protocols = [TLSv1.2, TLSv1.1, TLSv1]

        ssl.endpoint.identification.algorithm = null

        ssl.key.password = null

        ssl.keymanager.algorithm = SunX509

        ssl.keystore.location = null

        ssl.keystore.password = null

        ssl.keystore.type = JKS

        ssl.protocol = TLS

        ssl.provider = null

        ssl.secure.random.implementation = null

        ssl.trustmanager.algorithm = PKIX

        ssl.truststore.location = null

        ssl.truststore.password = null

        ssl.truststore.type = JKS

        transaction.timeout.ms = 60000

        transactional.id = null

        value.serializer = class org.apache.kafka.common.serialization.StringSerializer

[2019-04-25T16:19:46,705][INFO ][org.apache.kafka.common.utils.AppInfoParser] Kafka version : 1.1.0

[2019-04-25T16:19:46,706][INFO ][org.apache.kafka.common.utils.AppInfoParser] Kafka commitId : fdcf75ea326b8e07

[2019-04-25T16:19:46,854][INFO ][logstash.pipeline        ] Pipeline started successfully {:pipeline_id=>"main", :thread=>"#<Thread:0x11d30400 run>"}

The stdin plugin is now waiting for input:

[2019-04-25T16:19:47,009][INFO ][logstash.agent           ] Pipelines running {:count=>1, :running_pipelines=>[:main], :non_running_pipelines=>[]}

[2019-04-25T16:19:47,417][INFO ][logstash.agent           ] Successfully started Logstash API endpoint {:port=>9600}

二、使用Logstash抽取mysql数据到kafka

配置文件：

input {

        stdin {}

        jdbc {

                type => "jdbc"

                jdbc_connection_string => "jdbc:mysql://192.168.200.100:3306/yang?characterEncoding=UTF-8&autoReconnect=true"

                 # 数据库连接账号密码；

                jdbc_user => "root"

                jdbc_password => "010209"

                 # MySQL依赖包路径；

                jdbc_driver_library => "/mnt/mysql-connector-java-5.1.38.jar"

                 # the name of the driver class for mysql

                jdbc_driver_class => "com.mysql.jdbc.Driver"

                statement => "SELECT * FROM `im`"

        }

}

output {

        kafka{

                 topic_id => "test"

                 bootstrap_servers => "192.168.200.100:9092" # kafka的地址

                 batch_size => 5

        }

        stdout {

        }

}

Logstash学习之路（五）使用Logstash抽取mysql数据到kakfa的更多相关文章

Logstash学习之路（四）使用Logstash将mysql数据导入elasticsearch（单表同步、多表同步、全量同步、增量同步）
一.使用Logstash将mysql数据导入elasticsearch 1.在mysql中准备数据: mysql> show tables; +----------------+ | Table ...
logstash使用template提前设置好maping同步mysql数据到Elasticsearch5.5.2
上篇blog说到采用logstash-input-jdbc将mysql数据同步到ES(http://www.cnblogs.com/jstarseven/p/7704893.html),但是这里有一个 ...
Logstash学习之路（一）Logstash的安装
一.Logstash简介 Logstash 是一个实时数据收集引擎,可收集各类型数据并对其进行分析,过滤和归纳.按照自己条件分析过滤出符合数据导入到可视化界面.它可以实现多样化的数据源数据全量或增量传 ...
Logstash学习之路（二）Elasticsearch导入json数据文件
一.数据从文件导入elasticsearch 1.数据准备: 1.数据文件:test.json 2.索引名称:index 3.数据类型:doc 4.批量操作API:bulk {"index& ...
Logstash学习之路（三）Logstash处理时区、类型转换、删除字段的案例配置
#输入 input { file { path => ["文件路径"] #自定义类型 type => "自定义" start_position =& ...
redis——学习之路五(简单的C#使用redis)
redis官方推荐使用的客户端程序打星星表示推荐使用的客户端程序,一个笑脸表示最近6个月内有过正式活动的.http://redis.io/clients/#c 从这里我们可以判断官方推荐我们使用Se ...
zigbee学习之路(五):定时器1(查询方式)
一.前言今天,我们来学习几乎所有单片机都有的功能,定时器的使用,定时器对单片机来说是相当重要的,有了它,单片机就可以进行一些复杂的工作. 二.原理与分析谈到定时器的控制,我们最先想到的是要给它赋初 ...
MongoDB学习之路(五)
MongoDB $type 操作符类型数字备注 Double 1 String 2 Object 3 Array 4 Binary data 5 Undefined 6 已废弃 Object i ...
Java学习之路(五)：常见的对象操作
Object对象我们先来介绍一下API API(Application Programming Interface):应用程序编程接口 Java API 就是Java提供给我们使用的类,这些类将底层 ...

随机推荐

PyQt（Python+Qt）学习随笔：调用disconnect进行信号连接断开时的信号签名与断开参数的匹配要求
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址在使用信号调用disconnect()方法断开信号和槽的连接时,信号可以带签名也可不带签名,参数可以 ...
AutumnWater 秋水SRC平台
持续给自己挖坑,简单介绍一下AutumnWater 秋水SRC平台趴: SRC开源漏洞响应平台 AutumnWater 秋水SRC平台后端使用Python-Flask(蓝图)编写前端使用少量VUE ...
【面试题】GC Root都有哪些？
那天去面试,面试官问我JVM垃圾回收,我是有备而来,上来就是一个可达性分析算法,然后就是一个复制算法,标记-清理,标记-整理,以及几个常见的垃圾回收器详情见:https://www.cnblogs. ...
filebeat输出结果到elasticsearch的多个索引
基本环境: filebeat版本:6.5.4 (Linux,x86-64) elasticsearch版本:6.54 (一)需求说明在一台服务器上有多个日志需要使用filebeat日志收集到el ...
Python+Selenium基本语法
对Selenium自动化已有了解,最近开始做h5端的自动化,所以总结了下Python+Selenium自动化基本语法一.启动浏览器 1.普通方式启动 #coding=utf-8 import tim ...
Reflect个人记录
Reflect是一个内置方法,并不能通过构造函数的来进行构建 Reflect.construct: 与new操作父有一些类似,相当于new target(...) 例: 我们先自己定义一个类 clas ...
postgresql 运行sql文件
方法一: [postgres@node01 ~]$ psql -Upostgres postgres=# \l List of databases Name | Owner | Encoding | ...
Maven笔记之核心概念及常用命令
Maven的核心概念 Maven是一款服务于java平台的自动化构建工具. 自动化构建工具还有:make->ant->maven->gradle 1.约定的目录 2.P ...
css 13-CSS3属性：Flex布局图文详解
13-CSS3属性:Flex布局图文详解 #前言 CSS3中的 flex 属性,在布局方面做了非常大的改进,使得我们对多个元素之间的布局排列变得十分灵活,适应性非常强.其强大的伸缩性和自适应性,在网页 ...
vue第一单元(初识webpack-webpack的功能-webpack的初步使用)
第一单元(初识webpack-webpack的功能-webpack的初步使用) #课程目标了解webpack出现的意义,以及webpack解决的前端问题掌握webpack的使用流程和步骤掌握we ...

Logstash学习之路（五）使用Logstash抽取mysql数据到kakfa

Logstash学习之路（五）使用Logstash抽取mysql数据到kakfa的更多相关文章

随机推荐

热门专题