1. logstash核心配置文件pipelines.yml

     #注:此处的 - 必须顶格写必须!!!
    - pipeline.id: invitation
    #下面路径配置的是你同步数据是的字段映射关系
    path.config: /opt/apps/logstash/config/invitation/invitation.conf
  2. 同步数据时的字段映射关系配置文件invitation.conf。注:路径一定跟你pipelines.yml配置文件中的一样

     input {
    
     jdbc {
    #驱动jar包的位置
    jdbc_driver_library => "/opt/apps/logstash/lib/mysql-connector-java-8.0.13.jar"
    #驱动类名
    jdbc_driver_class => "com.mysql.cj.jdbc.Driver"
    #MySQL的链接
    jdbc_connection_string => "jdbc:mysql://192.168.0.234:3306/community?characterEncoding=utf8&useSSL=false&serverTimezone=UTC&rewriteBatchedStatements=true"
    #数据库用户名
    jdbc_user => "mostchh"
    #数据库密码
    jdbc_password => "1qaz2wsx3edc"
    #数据库重连尝试次数
    connection_retry_attempts => "3"
    #超时时间
    jdbc_validation_timeout => "3600"
    #开启分页查询(默认false不开启)
    jdbc_paging_enabled => "true"
    #单次分页查询条数(默认100000,若字段较多且更新频率较高,建议调低此值)
    jdbc_page_size => "500"
    #时区
    #jdbc_default_timezone =>"Asia/Shanghai"
    #如果sql较复杂,建议配通过statement_filepath配置sql文件的存放路径;
    statement_filepath => "/opt/apps/logstash/sql/invitation/invitation.sql"
    #需要记录查询结果某字段的值时,此字段为true
    use_column_value => true
    #是否设置字段为小写,默认是true
    lowercase_column_names => false
    #需要记录的递增字段,用于增量同步,下次只同步比该值大的数据
    tracking_column => "modifiedTime"
    #递增的字段类型
    tracking_column_type => "timestamp"
    #记录上一次运行记录
    record_last_run => true
    #上一次同步的递增字段存放文件路径
    last_run_metadata_path => "/opt/apps/logstash/station/invitation.txt"
    #是否清除last_run_metadata_path的记录,需要增量同步时此字段必须为false
    clean_run => false
    #自动同步数据的cron表达式,下面是一秒执行一次
    schedule => "*/1 * * * * *"
    #对应你pipelines配置文件的ID
    type => "invitation" } }
    #数据处理的过滤器
    filter {
    aggregate {
    task_id => "%{cardId}"
    code => "
    map['cardId'] = event.get('cardId')
    map['title'] = event.get('title')
    map['content'] = event.get('content')
    map['issueUserId'] = event.get('issueUserId')
    map['issueUserName'] = event.get('issueUserName')
    map['issueUserIcon'] = event.get('issueUserIcon')
    map['issueTime'] = event.get('issueTime')
    map['revealStatus'] = event.get('revealStatus')
    map['commentNum'] = event.get('commentNum')
    map['isMeLike'] = event.get('isMeLike')
    map['giveLikeNum'] = event.get('giveLikeNum')
    map['isDelete'] = event.get('isDelete')
    map['issueStatus'] = event.get('issueStatus')
    map['cardStatus'] = event.get('cardStatus')
    map['giveLikeUsers'] ||=[]
    #数据一对多的处理
    if (event.get('userId') != nil)
    if !(map['giveLikeUsers'].include? event.get('userId'))
    map['giveLikeUsers'] << event.get('userId')
    end
    end
    map['file_list'] ||=[]
    map['fileList'] ||=[]
    #数据一对多的处理
    if (event.get('fileId') != nil)
    if !(map['file_list'].include? event.get('fileId'))
    map['file_list'] << event.get('fileId')
    map['fileList'] << {
    'fileId' => event.get('fileId'),
    'fileName' => event.get('fileName'),
    'fileUrl' => event.get('fileUrl')
    }
    end
    end
    event.cancel()
    " push_previous_map_as_event => true
    timeout => 5
    }
    mutate {
    }
    mutate {
    #过滤不需要的字段
    remove_field => ["@timestamp","@version"]
    }
    } output {
    elasticsearch {
    document_id => "%{cardId}"
    document_type => "_doc"
    index => "bbs_card_management"
    hosts => ["http://192.168.0.178:9200"]
    }
    stdout{
    codec => rubydebug
    }
    }
  3. 同步数据的SQL配置文件invitation.sql,具体的SQL就根据你的业务来定了,我这里用的视图所以SQL比较简单。注:路径一定跟你invitation.conf配置文件中的一样

     SELECT
    *
    FROM
    invitation
    WHERE
    modifiedTime >= :sql_last_value
    AND modifiedTime < NOW()

    此处的:sql_last_value 取得就是你递增字段存放地址中的值

  4. 递增字段存放文件invitation.txt。注:路径一定跟你invitation.conf配置文件中的一样

     --- 2021-08-30 15:22:08.000000000 +00:00

    配置的存放类型是时间类型,存储格式就是这样的。

以上就是logstash的所有配置了,只需要运行即可实现一秒同步一次数据,当然具体多久同步根据你具体的需求来定。

关于MySQL导入数据到elasticsearch的小工具logstash的更多相关文章

  1. 安装配置elasticsearch、安装elasticsearch-analysis-ik插件、mysql导入数据到elasticsearch、安装yii2-elasticsearch及使用

    一.安装elasticsearch 获取elasticsearch的rpm:wget https://download.elastic.co/elasticsearch/release/org/ela ...

  2. 使用Sqoop从MySQL导入数据到Hive和HBase 及近期感悟

    使用Sqoop从MySQL导入数据到Hive和HBase 及近期感悟 Sqoop 大数据 Hive HBase ETL 使用Sqoop从MySQL导入数据到Hive和HBase 及近期感悟 基础环境 ...

  3. 教程 | 使用Sqoop从MySQL导入数据到Hive和HBase

    基础环境 sqoop:sqoop-1.4.5+cdh5.3.6+78, hive:hive-0.13.1+cdh5.3.6+397, hbase:hbase-0.98.6+cdh5.3.6+115 S ...

  4. mysql导入数据到oracle中

    mysql导入数据到oracle中. 建立Oracle表: CREATE TABLE "GG_USER" ( "USERID" BYTE) NOT NULL, ...

  5. mysql导入数据load data infile用法

    mysql导入数据load data infile用法 基本语法: load data [low_priority] [local] infile 'file_name txt' [replace | ...

  6. elasticsearch -- Logstash实现mysql同步数据到elasticsearch

    配置 安装插件由于这里是从mysql同步数据到elasticsearch,所以需要安装jdbc的入插件和elasticsearch的出插件:logstash-input-jdbc.logstash-o ...

  7. 使用sqoop从mysql导入数据到hive

      目录 前言 一.使用的导入命令 二.遇到的问题及解决 1. 用文本字段进行分区的问题 2. Hadoop历史服务器Hadoop JobHistory没开启的问题 3. 连接元数据存储数据库报错 4 ...

  8. MYSQL导入数据出现The MySQL server is running with the --secure-file-priv

    MYSQL导入数据出现The MySQL server is running with the --secure-file-priv option so it cannot execute this ...

  9. MySQL导入数据遇到Error Number: 1467 Failed to read auto-increment value from storage engine错误

    MySQL导入数据遇到Error Number: 1467 Failed to read auto-increment value from storage engine错误 创建表的语句 CREAT ...

随机推荐

  1. Google Guava 常用集合方法

    /** * Author: momo * Date: 2018/6/7 * Description: */ public class ListTest { public static void mai ...

  2. 阿里云esc 登录时的相关提示

    1. 如果该ecs 未绑定密钥对,可以通过常规的用户名密码登录 2. 如果该 ecs 绑定了密钥对,则需要通过私钥进行登录 3. 如果使用 比如 securityCRT 登录时报 " A p ...

  3. 一个超简单的Microsoft Edge Extension

    这个比微软官网上的例子简单很多,适合入门.总共4个文件: https://files.cnblogs.com/files/blogs/714801/cet6wordpicker.zip 36KB 1. ...

  4. 车载以太网第二弹|测试之实锤 -DoIP测试开发实践

    前言 车载以太网测试之实锤系列,之前我们已经从环境设备组成.被测对象组成再到测试过程和测试结果分析,分享了完整的PMA测试 .IOP测试 .TC8中的TCP/IP协议一致性测试 .也分享了1000BA ...

  5. Java Web三大组件之过滤器(Filter)

    什么是过滤器?有什么用? 过滤器JavaWeb三大组件之一,它与Servlet很相似.不过滤器是用来拦截请求的,而不是处理请求的.过滤,顾名思义,就是留下我们想要的,丢掉我们不需要的.例如:某个网站的 ...

  6. Table.PromoteHeaders升降标题Table…Headers(Power Query 之 M 语言)

    数据源: 任意数据源 目标: 将第一行提升为标题 操作过程: [主页](或[转换])>[将第一行用作标题] M公式: = Table.PromoteHeaders( 表, [PromoteAll ...

  7. mysql 禁止自动提交设置

    mysql禁止自动提交的设置, 在my.ini文件里加上如下的一句便可 init_connect='SET autocommit=0' 但是有个问题,对root用户进行autocommit变量的查询, ...

  8. Birt报表设置自定义的值

    比如数据库查出该字段的值有"no",有"yes",那么想要根据当是no是显示"未完成",当是yes时显示"已完成" 可以 ...

  9. JAVA日期Date格式转corn表达式

    date转corn 定时任务获取corn /*** * 日期转corn表达式 * @param date 日期 * @return */ public static String getCron(Da ...

  10. 【LeetCode】365. Water and Jug Problem 解题报告(Python)

    作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 数学题 相似题目 参考资料 日期 题目地址:http ...