Storm 实时读取本地文件操作（模拟分析网络日志）

WebLogProduct

产生日志类

package top.wintp.weblog;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.util.Date;

import java.util.Random;

import java.util.UUID;

/**

 * @description: description:生成网络日志

 * <p>

 * @author: upuptop

 * <p>

 * @qq: 337081267

 * <p>

 * @CSDN: http://blog.csdn.net/pyfysf

 * <p>

 * @cnblogs: http://www.cnblogs.com/upuptop

 * <p>

 * @blog: http://wintp.top

 * <p>

 * @email: pyfysf@163.com

 * <p>

 * @time: 2019/06/2019/6/5

 * <p>

 */

public class WebLogProduct {

    public static void main(String[] args) {

        //网站

        String[] webUrl = {

                "http://www.wintp.top",

                "http://upuptop.top",

                "http://github.com",

                "http://gitee.com"};

        //用户会话id

        String[] userSessionId = {

                "F5CC242E006B4A81BDE72E03BC7BD34D",

                "FA8C3631CE024ED5B98A65EE7F2600E2",

                "52EF144D16C24AC0912003539654824A",

                "F78F115B613A495F961B194EB2A377C6"};

        String[] scanDate = {

                "2019-6-5 23:29:00",

                "2019-4-5 22:39:20",

                "2019-7-5 21:09:05",

                "2019-8-5 20:19:08"

        };

        StringBuilder sb = new StringBuilder();

        for (int i = 0; i < 30; i++) {

            int randomIndex = new Random().nextInt(3);

            sb.append(webUrl[randomIndex])

                    .append("\t")

                    .append(userSessionId[randomIndex])

                    .append("\t")

                    .append(scanDate[randomIndex])

                    .append("\n");

        }

        FileOutputStream fos = null;

        try {

            fos = new FileOutputStream("E:/weblog.log");

            fos.write(sb.toString().getBytes());

            System.out.println("write weblog.log success");

        } catch (FileNotFoundException e) {

            e.printStackTrace();

            System.out.println("write weblog.log fail");

        } catch (IOException e) {

            e.printStackTrace();

            System.out.println("write weblog.log fail");

        } finally {

            if (fos != null) {

                try {

                    fos.close();

                } catch (IOException e) {

                    e.printStackTrace();

                }

            }

        }

    }

}

WebLogSpout

读取日志类

package top.wintp.weblog;

import org.apache.storm.spout.SpoutOutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichSpout;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Values;

import java.io.BufferedReader;

import java.io.FileNotFoundException;

import java.io.FileReader;

import java.io.IOException;

import java.util.Map;

/**

 * @description: description:

 * <p>

 * @author: upuptop

 * <p>

 * @qq: 337081267

 * <p>

 * @CSDN: http://blog.csdn.net/pyfysf

 * <p>

 * @cnblogs: http://www.cnblogs.com/upuptop

 * <p>

 * @blog: http://wintp.top

 * <p>

 * @email: pyfysf@163.com

 * <p>

 * @time: 2019/06/2019/6/5

 * <p>

 */

public class WebLogSpout extends BaseRichSpout {

    private SpoutOutputCollector collector;

    private BufferedReader mReader;

    public void open(Map map, TopologyContext topologyContext, SpoutOutputCollector spoutOutputCollector) {

        //向下写出数据使用

        this.collector = spoutOutputCollector;

        //    初始化方法 读取文件

        try {

            mReader = new BufferedReader(new FileReader("E:/weblog.log"));

        } catch (FileNotFoundException e) {

            e.printStackTrace();

        }

    }

    String log = null;

    public void nextTuple() {

        //循环调用该方法 在这里面读取数据

        try {

            while (null != (log = mReader.readLine())) {

                //写出数据

                this.collector.emit(new Values(log));

            }

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

    public void declareOutputFields(OutputFieldsDeclarer outputFieldsDeclarer) {

        //写出数据的名称

        outputFieldsDeclarer.declare(new Fields("log"));

    }

}

WebLogBlot

处理日志类

package top.wintp.weblog;

import org.apache.storm.topology.BasicOutputCollector;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseBasicBolt;

import org.apache.storm.tuple.Tuple;

import org.slf4j.Logger;

import org.slf4j.LoggerFactory;

public class WebLogBlot extends BaseBasicBolt {

    private static final Logger logger = LoggerFactory.getLogger(WebLogBlot.class);

    /**

     * 统计数据个数

     */

    private int count;

    public void execute(Tuple tuple, BasicOutputCollector basicOutputCollector) {

        count++;

        //    处理数据的方法

        //http://www.wintp.top	F5CC242E006B4A81BDE72E03BC7BD34D	2019-6-5 23:29:00

        String log = tuple.getStringByField("log");

        String[] split = log.split("\t");

        String webUrl = split[0];

        String userSessionId = split[1];

        logger.error("WebLogBlot  execute()   sessionId:{},ThreadId:{},webUrl:{},count:{}   ", userSessionId, Thread.currentThread().getId(), webUrl, count);

    }

    public void declareOutputFields(OutputFieldsDeclarer outputFieldsDeclarer) {

        //不需要在向下写出数据

    }

}

WebLogDevice

提交拓扑测试类

package top.wintp.weblog;

import org.apache.storm.Config;

import org.apache.storm.LocalCluster;

import org.apache.storm.StormSubmitter;

import org.apache.storm.generated.AlreadyAliveException;

import org.apache.storm.generated.AuthorizationException;

import org.apache.storm.generated.InvalidTopologyException;

import org.apache.storm.topology.TopologyBuilder;

public class WebLogDevice {

    public static void main(String[] args) {

        //    创建拓扑

        TopologyBuilder topologyBuilder = new TopologyBuilder();

        //    设置spout bolt

        topologyBuilder.setSpout("WebLogSpout", new WebLogSpout(), 1);

        topologyBuilder.setBolt("WebLogBolt", new WebLogBlot(), 1).shuffleGrouping("WebLogSpout");

        //    获取配置

        Config config = new Config();

        //    设置workers

        config.setNumWorkers(1);

        //    提交拓扑

        if (args.length > 0) {

            //    集群提交

            try {

                StormSubmitter.submitTopology(args[0], config, topologyBuilder.createTopology());

            } catch (AlreadyAliveException e) {

                e.printStackTrace();

            } catch (InvalidTopologyException e) {

                e.printStackTrace();

            } catch (AuthorizationException e) {

                e.printStackTrace();

            }

        } else {

            //    本地提交

            LocalCluster localCluster = new LocalCluster();

            localCluster.submitTopology("WebLogTopology", config, topologyBuilder.createTopology());

        }

    }

}

控制台打印结果

不关闭程序，修改日志文件（注意分割的格式使用\t）控制台打印结果追加

Storm 实时读取本地文件操作（模拟分析网络日志）的更多相关文章

H5读取本地文件操作
H5读取本地文件操作本文转自:转:http://hushicai.com/2014/03/29/html5-du-qu-ben-di-wen-jian.html感谢大神分享. 常见的语言比如php. ...
【转】flash air中读取本地文件的三种方法
actionscript中读取本地文件操作有两种代码如下 1.使用File和FileStream两个类,FileStream负责读取数据的所以操作:(同步操作) var stream:FileStre ...
Storm实时计算：流操作入门编程实践
转自:http://shiyanjun.cn/archives/977.html Storm实时计算:流操作入门编程实践 Storm是一个分布式是实时计算系统,它设计了一种对流和计算的抽象,概念比 ...
.NET 读取本地文件绑定到GridViewRow
wjgl.aspx.cs: using System; using System.Collections; using System.Configuration; using System.Data; ...
python 读取本地文件批量插入mysql
Uin_phone.txt 本地文件内容有1000条,这里只是展示前几条,供参考 133584752 133584759 133584764 133584773 133584775 13358477 ...
FileReader读取本地文件
FileReader是一种异步读取文件机制,结合input:file可以很方便的读取本地文件. 一.input:type[file] file类型的input会渲染为一个按钮和一段文字.点击按钮可打开 ...
HTML5 本地文件操作之FileSystemAPI实例（三）
文件夹操作demo 1.读取根目录文件夹内容 window.requestFileSystem = window.requestFileSystem || window.webkitRequestFi ...
HTML5 本地文件操作之FileSystemAPI实例（二）
文件操作实例整理二 1.删除文件.复制文件.移动文件 //获取请求权限 window.requestFileSystem = window.requestFileSystem || window.we ...
HTML5 本地文件操作之FileSystemAPI实例（一）
文件操作实例整理一 1.请求系统配额类型 console.info(window.TEMPORARY); //0 临时 console.info(window.PERSISTENT); //1 持久 ...

随机推荐

java基础之super关键字
一.在java里面,对于super关键字通常有两种用法: 1. 用在子类的构造方法里(初始化用),主要是调用父类的默认构造方法,如果父类有不止一个构造方法,可以通过super指定具体的构造函数,比如 ...
Python：Pandas学习
import pandas as pd import numpy as np s = pd.Series([1, 3, 6, np.nan, 44, 1]) df= pd.DataFrame(np.r ...
ASP.NET 5 (vNext) 牛刀小試：自帶 DI 容器
小引在 ASP.NET 5(vNext)之前,亦即 MVC 4/5.Web API 2 的时代,MVC 与 Web API 框架彼此有非常相似的设计,却是以不同的代码来实现.现在,ASP.NET 5 ...
修改zookeeper jvm参数
在zkServer.sh中,增加以下参数: start) echo -n "Starting zookeeper ... " if [ -f $ZOOPIDFILE ...
pycharm窗口选项卡管理
1.主题我们已经注意到Pycharm的主编辑框是基于窗口选项卡机制显示的,Pycharm选项卡多种多样,这里我们将详细介绍这种选项卡机制. 2.激活的选项卡每当我们打开一个Python文件时op ...
每日一问：到底为什么属性动画后 View 在新位置还能响应事件
在 Android 开发中,我们难免会使用动画来处理各种各样的动画效果,以满足 UI 的高逼格设计.对于比较复杂的动画效果,我们通常会采用著名的开源库:lottie-android,或许你会对 lot ...
Spring Boot2(一)：使用Spring Boot2集成Mybatis基础搭建
Mybatis 初期使用比较麻烦,需要各种配置文件.实体类.Dao 层映射关联.还有一大推其它配置.mybatis-spring-boot-starter 就是 Spring Boot+ Mybati ...
python学习之路--python基础之列表操作
本文主要介绍下python列表的的一些基本操作列表是我们在python编程中常用的数据类型之一,通过列表我们可以对数据实现最方便的存储.修改等操作. 定义列表 names=['ZhangSan',' ...
Git使用小技巧之Stash命令藏储零乱分支
想要获取更多文章可以访问我的博客 - 代码无止境. 在开发的过程中可能会经常出现下面这种情况,我们正在开发某个功能,当前分支的内容比较乱,不太适合提交,而此时我们需要切换到其他分支上处理一些事情.这 ...
InnoDB存储引擎--学习笔记-redo log
目录 1. 引言 2. 重做日志文件和相关概念介绍 + 2.1. 重做日志文件和bin log + 2.2. LSN(log squence number) 3. 重做日志文件基本工作原理 4. 重做 ...

Storm 实时读取本地文件操作（模拟分析网络日志）

Storm 实时读取本地文件操作（模拟分析网络日志）的更多相关文章

随机推荐

热门专题