flume学习安装

近期项目组有需求点击流日志须要自己收集，学习了一下flume而且成功安装了。相关信息记录一下。

1）下载flume1.5版本号

wget http://www.apache.org/dyn/closer.cgi/flume/1.5.0.1/apache-flume-1.5.0.1-bin.tar.gz

2) 解压flume1.5

tar -zxvf apache-flume-1.5.0.1-bin.tar.gz

3) 配置环境变量

jdk已装

export FLUME_HOME=/XXX/XX/apache-flume-1.5.0.1-bin

export PATH=$FLUME_HOME/bin:$PATH

4) 配置conf相关文件

4.1) 配置flume-env.sh 主要设置一下JAVA_HOME

4.2) 配置log4j.properties

假设是測试环境凝视掉flume.root.logger=INFO,LOGFILE选择flume.root.logger=DEBUG,console把日志打印到控制台

4.3) 配置flume-conf.properties 这个文件名称能够随便改执行命令时指定你自己创建的属性文件就可以

#set agent 名字为a1 sources名字为r1 sinks名字为k1 channels名字为c1

a1.sources = r1

a1.sinks = k1

a1.channels = c1

sources组件类型为exec 运行linux命令

a1.sources.r1.type = exec

a1.sources.r1.command = tail -F /home/hadoop/flume/flume/conf/source.txt (大小tail -f有非常大差别，攻克了我们一个大问题)

sinks组件类型为logger

a1.sinks.k1.type = logger

channels组件类型为内存

a1.channels.c1.type = memory

a1.channels.c1.capacity = 1000

a1.channels.c1.transactionCapacity = 100

把sources、sinks与管道连通起来

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

5) 在flume文件夹下执行命令

bin/flume-ng agent -n a1 -f test/source-tail-sink-logger.properties --conf conf

初步的样例完毕了。眼下我们生产环境是有两个节点往metaq里面生产数据。 metaq自己定义一个sink(自己定义sink见后面代码)

记得把metaq相关jar放到flume/lib下 gecko-1.1.4.jar metamorphosis-client-1.4.6.2.jar metamorphosis-commons-1.4.6.2.jar zkclient-0.3.jar zookeeper-3.4.3.jar

a1.sources = r1

a1.sinks = k1

a1.channels = c1

a1.sources.r1.type = exec

a1.sources.r1.command = tail -F /home/hadoop/flume/flume/conf/source.txt

a1.sinks.k1.type = com.XX.flume.sink.MetaQSink

a1.sinks.k1.sink.zkConnect = 0.0.0.0:2181,0.0.0.0:2181,0.0.0.0:2181

a1.sinks.k1.sink.zkRoot = /meta(此文件夹必须写死)

a1.sinks.k1.sink.topic = XXXX

a1.sinks.k1.sink.batchSize = 20000

#a1.channels.c1.type = memory

#a1.channels.c1.capacity = 1000000

#a1.channels.c1.transactionCapacity = 100000

a1.channels.c1.type = file

a1.channels.c1.checkpointDir = /home/hadoop/flume/flume/channel/checkpoint

a1.channels.c1.dataDirs = /home/hadoop/flume/flume/channel/data

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

自己定义sink代码

</pre><pre name="code" class="java">package com.jd.flume.sink;

import com.taobao.metamorphosis.Message;

import com.taobao.metamorphosis.client.MessageSessionFactory;

import com.taobao.metamorphosis.client.MetaClientConfig;

import com.taobao.metamorphosis.client.MetaMessageSessionFactory;

import com.taobao.metamorphosis.client.producer.MessageProducer;

import com.taobao.metamorphosis.client.producer.SendResult;

import com.taobao.metamorphosis.exception.MetaClientException;

import com.taobao.metamorphosis.utils.ZkUtils;

import org.apache.flume.*;

import org.apache.flume.conf.Configurable;

import org.apache.flume.sink.AbstractSink;

import org.slf4j.Logger;

import org.slf4j.LoggerFactory;

import java.util.concurrent.CountDownLatch;

import java.util.concurrent.ExecutorService;

import java.util.concurrent.Executors;

import java.util.concurrent.atomic.AtomicInteger;

/**

 * 功能描写叙述：

 * <p/>

 *      这个类主要是将flume收集的数据发送到metaq消息队列中

 * <p/>

 * ----------------------------

 */

public class MetaQSink extends AbstractSink implements Configurable {

    private static final Logger logger = LoggerFactory.getLogger(MetaQSink.class);

    private MessageSessionFactory sessionFactory;

    private MessageProducer producer;

    private String zkConnect;

    private String zkRoot;

    private String topic;

    private int batchSize;

    private int threadNum;

    private ExecutorService executor;

    public MetaQSink() {

    }

    @Override

    public void configure(Context context) {

        this.zkConnect = context.getString("sink.zkConnect");

        this.zkRoot = context.getString("sink.zkRoot");

        this.topic = context.getString("sink.topic");

        this.batchSize = context.getInteger("sink.batchSize", 10000);

        this.threadNum = context.getInteger("sink.threadNum", 50);

        executor = Executors.newCachedThreadPool();

        MetaClientConfig metaClientConfig = new MetaClientConfig();

        ZkUtils.ZKConfig zkConfig = new ZkUtils.ZKConfig();

        zkConfig.zkConnect = zkConnect;

        zkConfig.zkRoot = zkRoot;

        metaClientConfig.setZkConfig(zkConfig);

        try {

            sessionFactory = new MetaMessageSessionFactory(metaClientConfig);

        } catch (MetaClientException e) {

            e.printStackTrace();

            logger.error("", e);

            throw new RuntimeException("init error");

        }

        producer = sessionFactory.createProducer();

        logger.info("zkConnect:" + zkConnect + ", zkRoot:" + zkRoot

                + ", topic:" + topic);

    }

    @Override

    public Status process() throws EventDeliveryException {

        long start = System.currentTimeMillis();

        producer.publish(topic);

        Status result = Status.READY;

        final Channel channel = getChannel();

        final AtomicInteger al = new AtomicInteger(0);

        final CountDownLatch cdl = new CountDownLatch(threadNum);

        for (int t = 0; t < threadNum; t++) {

            executor.execute(new Runnable() {

                @Override

                public void run() {

                    Event event = null;

                    Transaction transaction = null;

                    int i = 0;

                    try {

                        transaction = channel.getTransaction();

                        transaction.begin();

                        boolean startTransaction = false;

                        for (i = 0; i < batchSize; i++) {

                            event = channel.take();

                            if (event != null) {

                                if (i == 0) {

                                    producer.beginTransaction();

                                    startTransaction = true;

                                }

                                final SendResult sendResult = producer

                                        .sendMessage(new Message(topic, event

                                                .getBody()));

                                // check result

                                if (!sendResult.isSuccess()) {

                                    logger.error("Send message failed,error message:"

                                            + sendResult.getErrorMessage());

                                    throw new RuntimeException(

                                            "Send message failed,error message:"

                                                    + sendResult

                                                    .getErrorMessage());

                                } else {

                                    logger.debug("Send message successfully,sent to "

                                            + sendResult.getPartition());

                                }

                            } else {

                                // No event found, request back-off semantics

                                // from the sink

                                // runner

                                // result = Status.BACKOFF;

                                break;

                            }

                        }

                        if (startTransaction) {

                            producer.commit();

                        }

                        al.addAndGet(i);

                        transaction.commit();

                    } catch (Exception ex) {

                        logger.error("error while rollback:", ex);

                        try {

                            producer.rollback();

                        } catch (Exception e) {

                            e.printStackTrace();

                        }

                        transaction.rollback();

                    } finally {

                        cdl.countDown();

                        transaction.close();

                    }

                }

            });

        }

        try {

            cdl.await();

        } catch (InterruptedException e) {

            e.printStackTrace();

        }

        if (al.get() == 0) {

            result = Status.BACKOFF;

        }

        logger.info("metaqSink_new,process:{},time:{},queue_size:{}",

                new Object[] { al.get(), System.currentTimeMillis() - start });

        return result;

    }

}

flume学习安装的更多相关文章

日志采集框架Flume以及Flume的安装部署（一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统）
Flume支持众多的source和sink类型,详细手册可参考官方文档,更多source和sink组件 http://flume.apache.org/FlumeUserGuide.html Flum ...
Flume学习总结
Flume学习总结 flume是一个用来采集数据的软件,它可以从数据源采集数据到一个集中存放的地方. 最常用flume的数据采集场景是对日志的采集,不过,lume也可以用来采集其他的各种各样的数据,因 ...
flume学习（三）：flume将log4j日志数据写入到hdfs（转）
原文链接:flume学习(三):flume将log4j日志数据写入到hdfs 在第一篇文章中我们是将log4j的日志输出到了agent的日志文件当中.配置文件如下: tier1.sources=sou ...
Flume学习应用：Java写日志数据到MongoDB
概述 Windows平台:Java写日志到Flume,Flume最终把日志写到MongoDB. 系统环境操作系统:win7 64 JDK:1.6.0_43 资源下载 Maven:3.3.3下载.安装 ...
Flume的安装与配置
Flume的安装与配置一. 资源下载资源地址:http://flume.apache.org/download.html 程序地址:http://apache.fayea.com/fl ...
Flume学习之路（一）Flume的基础介绍
一.背景 Hadoop业务的整体开发流程: 从Hadoop的业务开发流程图中可以看出,在大数据的业务处理过程中,对于数据的采集是十分重要的一步,也是不可避免的一步. 许多公司的平台每天会产生大量的日志 ...
日志收集框架flume的安装及简单使用
flume介绍 Flume是一个分布式.可靠.和高可用的海量日志采集.聚合和传输的系统. Flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到HDFS.hbase.h ...
Flume(3)-安装部署
一. 下载 Flume官网地址 http://flume.apache.org/ 文档查看地址 http://flume.apache.org/FlumeUserGuide.html 下载地址 htt ...
linux自学（九）之开始centos学习,安装数据库MariaDB
上一篇:linux自学(八)之开始centos学习,安装tomcat 数据库我们不安装mysql,我网上看了好多资料发现mysql安装比较麻烦,我们这里安装同一个父亲的产品MariaDB.驱动,端口等 ...

随机推荐

Jquery常用功能
jQuery 1.4给开发者带来了很多值得兴奋的新特性,同时使用jQuery的人也越来越多,为了方便大家对jQuery的使用,下面列出了一些jQuery使用技巧.比如有禁止右键点击.隐藏搜索文本框文字 ...
SNN--Second Name Node
NameNode有这么几个配置: Property Description Suggested value dfs.name.dir Directory in NameNode’s local fil ...
JSP三大指令 /9大内置对象 /Javabean / EL
一个jsp页面中,可以有0~N个指令的定义! 1. page --> 最复杂:<%@page language="java" info="xxx". ...
css:中文词不断开，整体换行
一.问题关于文字的换行与不换行的问题有些特殊情况,是使用css的word-break等属性实现不了的,下面的情况就证明了: 我们想要的效果是,一个词整体换行或不换行,“兼职测试”可以都换至第二行 ...
Unity干中学——如何实现游戏截图？
using UnityEngine; using System.Collections; using System.IO; public class ScreenShot : MonoBehaviou ...
iOS程序开发引用的第三方库之间出现duplicate symbol时的处理方法
iOS程序集成的第三方库过多时,很容易出现某几个库同时用到了一样的函数库,也就是在你的程序link时会提示duplicate symbol,而重复的符号又不是由你自己程序的代码造成的,也就说没法通过直 ...
关于C51内的code，idata，xdata
从数据存储类型来说,8051系列有片内.片外程序存储器,片内.片外数据存储器,片内程序存储器还分直接寻址区和间接寻址类型,分别对应code.data.xdata.idata以及根据51系列特点而设定的 ...
_CrtSetBreakAlloc简单内存泄漏检测方法，解决Detected memory leaks!问题
我的环境是: XP SP2 . VS2003 最近在一个项目中,程序退出后都出现内存泄漏: Detected memory leaks! Dumping objects -> {98500} n ...
从零开始制作jffs2文件系统
JFFS2 是一个开放源码的项目(www.infradead.org). 它是在闪存上使用非常广泛的读/写文件系统,在嵌入式系统中被普遍的应用. 1. 安装mkfs工具 MTD主页:htt ...
This configuration file was broken by system-config-keyboard
posts • Page of problem with startx Postby evarie » // :: Normally i can get started with the x wind ...

flume学习安装

flume学习安装的更多相关文章

随机推荐

热门专题