前提

安装Kafka前需要先安装zookeeper集群，集体安装方法请参照我的另一篇文档

Storm安装

下载

 wget https://mirrors.tuna.tsinghua.edu.cn/apache/storm/apache-storm-1.1.0/apache-storm-1.1.0.tar.gz

解压

tar -zxvf apache-storm-1.1.0.tar.gz

移动文件夹

mv apache-storm-1.1.0 /usr/local/hadoop/

vim storm.yaml

storm.zookeeper.servers:

     - "192.168.174.200"

     - "192.168.174.201"

nimbus.seeds: ["192.168.174.200"]

storm.local.dir: "/usr/local/hadoop/apache-storm-1.1.0/data"

storm.zookeeper.servers:表示zookeeper的集群地址，如果Zookeeper集群使用的不是默认端口，那么还需要配置storm.zookeeper.port
storm.zookeeper.port: Zookeeper集群的端口号
storm.local.dir: 用于配置Storm存储少量文件的路径
nimbus.seeds: 用于配置主控节点的地址，可以配置多个

拷贝文件到其余工作节点

scp apache-storm-1.1.0 salver1:/usr/local/hadoop/

Storm操作

启动主控节点

./storm nimbus 1>/dev/null 2>&1 &

启动主控节点管理界面

./storm ui 1>/dev/null 2>&1 &

启动工作节点

./storm supervisor 1>/dev/null 2>&1 &

访问地址

http://127.0.0.1:8080

运行拓扑

./storm jar storm-book.jar com.TopologyMain /usr/words.txt

删除拓扑

./storm kill Getting-Started-Toplogie

完整示例

package com;

import java.util.ArrayList;

import java.util.List;

import java.util.UUID;

import org.apache.storm.Config;

import org.apache.storm.LocalCluster;

import org.apache.storm.StormSubmitter;

import org.apache.storm.generated.AlreadyAliveException;

import org.apache.storm.generated.AuthorizationException;

import org.apache.storm.generated.InvalidTopologyException;

import org.apache.storm.kafka.KafkaSpout;

import org.apache.storm.kafka.SpoutConfig;

import org.apache.storm.kafka.StringScheme;

import org.apache.storm.kafka.ZkHosts;

import org.apache.storm.redis.bolt.RedisStoreBolt;

import org.apache.storm.redis.common.config.JedisPoolConfig;

import org.apache.storm.redis.common.mapper.RedisStoreMapper;

import org.apache.storm.spout.SchemeAsMultiScheme;

import org.apache.storm.topology.TopologyBuilder;

import org.apache.storm.tuple.Fields;

public class MykafkaSpout {

	/**

     * @param args

     * @throws AuthorizationException

     */

    public static void main(String[] args) throws AuthorizationException {

        // TODO Auto-generated method stub

    	String host = "127.0.0.1";

    	int port = 6385;

        String topic = "test" ;

        ZkHosts zkHosts = new ZkHosts("192.168.174.200:2181,192.168.174.201:2181");

        SpoutConfig spoutConfig = new SpoutConfig(zkHosts, topic,

                "",

                UUID.randomUUID().toString()) ;

        List<String> zkServers = new ArrayList<String>() ;

        zkServers.add("192.168.174.200");

        zkServers.add("192.168.174.201");

        spoutConfig.zkServers = zkServers;

        spoutConfig.zkPort = 2181;

        spoutConfig.socketTimeoutMs = 60 * 1000 ;

        spoutConfig.scheme = new SchemeAsMultiScheme(new StringScheme()) ;

        spoutConfig.startOffsetTime = kafka.api.OffsetRequest.LatestTime();

        TopologyBuilder builder = new TopologyBuilder() ;

        builder.setSpout("spout", new KafkaSpout(spoutConfig) ,1) ;

        builder.setBolt("bolt1", new MyKafkaBolt(), 2).shuffleGrouping("spout") ;

        builder.setBolt("MyCountBolt", new MyCountBolt(), 2).fieldsGrouping("bolt1", new Fields("type"));

        // 将所有单词及其次数进行汇总输出

        builder.setBolt("MyReportBolt", new MyReportBolt(), 2).globalGrouping("MyCountBolt");

        JedisPoolConfig poolConfig = new JedisPoolConfig.Builder().setHost(host).setPort(port).setPassword("Apple05101314").build();

        RedisStoreMapper storeMapper = new MyCountStoreMapper();

        RedisStoreBolt storeBolt = new RedisStoreBolt(poolConfig, storeMapper);

        //向redis保存数据

        builder.setBolt("redis-store-bolt", storeBolt).globalGrouping("MyReportBolt");

        Config conf = new Config ();

        conf.setDebug(false) ;

        if (args.length > 0) {

            try {

                StormSubmitter.submitTopology(args[0], conf, builder.createTopology());

            } catch (AlreadyAliveException e) {

                e.printStackTrace();

            } catch (InvalidTopologyException e) {

                e.printStackTrace();

            }

        }else {

            LocalCluster localCluster = new LocalCluster();

            localCluster.submitTopology("mytopology", conf, builder.createTopology());

        }

    }

}

package com;

import java.util.HashMap;

import java.util.Map;

import org.apache.storm.spout.SpoutOutputCollector;

import org.apache.storm.task.OutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.BasicOutputCollector;

import org.apache.storm.topology.IBasicBolt;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichBolt;

import org.apache.storm.topology.base.BaseRichSpout;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Tuple;

import org.apache.storm.tuple.Values;

public class MyKafkaBolt extends BaseRichBolt {

	private OutputCollector outputCollector;

	// key:messageId,Data

    private HashMap<String, String> waitAck = new HashMap<String, String>();

	public void prepare(Map map, TopologyContext context,

			OutputCollector collector) {

		// TODO Auto-generated method stub

		this.outputCollector = collector;

	}

	public void execute(Tuple input) {

		// TODO Auto-generated method stub

		String kafkaMsg = input.getString(0);

		if(kafkaMsg!=null){

			this.outputCollector.emit(new Values(kafkaMsg));

			this.outputCollector.ack(input);

		}

	}

	public void declareOutputFields(OutputFieldsDeclarer declarer) {

		// TODO Auto-generated method stub

		declarer.declare(new Fields("type"));

	}

}

package com;

import java.util.HashMap;

import java.util.Map;

import org.apache.storm.spout.SpoutOutputCollector;

import org.apache.storm.task.OutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.BasicOutputCollector;

import org.apache.storm.topology.IBasicBolt;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichBolt;

import org.apache.storm.topology.base.BaseRichSpout;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Tuple;

import org.apache.storm.tuple.Values;

public class MyCountBolt extends BaseRichBolt {

	private OutputCollector outputCollector;

	private HashMap<String, Integer> count;

	public void prepare(Map stormConf, TopologyContext context,

			OutputCollector collector) {

		// TODO Auto-generated method stub

		this.outputCollector = collector;

		this.count = new HashMap<String, Integer>();

	}

	public void execute(Tuple input) {

		// TODO Auto-generated method stub

		String type = input.getStringByField("type");

		int cnt = 1;

        if(count.containsKey(type)){

            cnt = count.get(type) + 1;

        }

        count.put(type, cnt);

        this.outputCollector.emit(new Values(type, cnt));

        this.outputCollector.ack(input);

	}

	public void declareOutputFields(OutputFieldsDeclarer declarer) {

		// TODO Auto-generated method stub

		declarer.declare(new Fields("type", "cnt"));

	}

}

package com;

import org.apache.storm.redis.common.mapper.RedisDataTypeDescription;

import org.apache.storm.redis.common.mapper.RedisStoreMapper;

import org.apache.storm.tuple.ITuple;

public class MyCountStoreMapper implements RedisStoreMapper {

    private RedisDataTypeDescription description;

    private final String hashKey = "myCount";

    public MyCountStoreMapper() {

        description = new RedisDataTypeDescription(

            RedisDataTypeDescription.RedisDataType.HASH, hashKey);

    }

    public RedisDataTypeDescription getDataTypeDescription() {

        return description;

    }

    public String getKeyFromTuple(ITuple tuple) {

        return tuple.getStringByField("zs");

    }

    public String getValueFromTuple(ITuple tuple) {

        return tuple.getIntegerByField("cnt")+"";

    }

}

package com;

import org.apache.storm.redis.bolt.RedisStoreBolt;

import org.apache.storm.redis.common.config.JedisPoolConfig;

import org.apache.storm.redis.common.mapper.RedisStoreMapper;

import org.apache.storm.task.OutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichBolt;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Tuple;

import org.apache.storm.tuple.Values;

import java.util.HashMap;

import java.util.Map;

import org.apache.log4j.Logger;

/**

 * Created by gzx on 17-2-6.

 */

public class MyReportBolt extends BaseRichBolt {

	private static Logger logger = Logger.getLogger(MyReportBolt.class);

	private OutputCollector outputCollector;

	private HashMap<String, Integer> count;

	public void prepare(Map map, TopologyContext topologyContext,

			OutputCollector collector) {

		this.count = new HashMap<String, Integer>();

		this.outputCollector = collector;

	}

	/**

	 * 打印单词及其出现次数

	 *

	 * @param tuple

	 */

	public void execute(Tuple tuple) {

		String type = tuple.getStringByField("type");

		int cnt = tuple.getIntegerByField("cnt");

		count.put(type, cnt);

		if (count.containsKey("join") && count.containsKey("out")) {

			int join = count.get("join");

			int out = count.get("out");

			int sy = join-out;

			System.out.println("join=" + join);

			System.out.println("out=" + out);

			//System.out.printf("===当前剩余总数==="+sy+"\r\n");

			logger.debug("===当前剩余总数==="+sy);

			this.outputCollector.emit(new Values("zs", sy));

	        this.outputCollector.ack(tuple);

		}

	}

	public void declareOutputFields(OutputFieldsDeclarer declarer) {

		declarer.declare(new Fields("zs", "cnt"));

	}

}

CentOS7搭建Storm集群及基础操作的更多相关文章

centos7搭建kafka集群-第二篇
好了,本篇开始部署kafka集群 Zookeeper集群搭建注:Kafka集群是把状态保存在Zookeeper中的,首先要搭建Zookeeper集群(也可以用kafka自带的ZK,但不推荐) 1.软 ...
在CentOS上搭建Storm集群
Here's a summary of the steps for setting up a Storm cluster: Set up a Zookeeper clusterInstall depe ...
centos7搭建kafka集群
一.安装jdk 1.下载jdk压缩包并移动到/usr/local目录 mv jdk-8u162-linux-x64.tar.gz /usr/local 2.解压 tar -zxvf jdk-8u162 ...
CentOS7搭建Hadoop2.8.0集群及基础操作与测试
环境说明示例环境主机名 IP 角色系统版本数据目录 Hadoop版本 master 192.168.174.200 nameNode CentOS Linux release 7.4.1708 ...
Centos7搭建zookeeper集群
centos7与之前的版本都不一样,修改主机名在/ect/hostname 和/ect/hosts 这两个文件控制首先修改/ect/hostname vi /ect/hostname 打开之后的内容 ...
【转】centos7 搭建etcd集群
转自http://www.cnblogs.com/zhenyuyaodidiao/p/6237019.html 一.简介 “A highly-available key value store for ...
初学Hadoop：利用VMWare+CentOS7搭建Hadoop集群
一.前言开始学习数据处理相关的知识了,第一步是搭建一个Hadoop集群.搭建一个分布式集群需要多台电脑,在此我选择采用VMWare+CentOS7搭建一个三台虚拟机组成的Hadoop集群. 注:1 ...
centos7搭建kafka集群-第一篇
Kafka初识 1.Kafka使用背景在我们大量使用分布式数据库.分布式计算集群的时候,是否会遇到这样的一些问题: 我们想分析下用户行为(pageviews),以便我们设计出更好的广告位我想对用户 ...
centos7搭建dolphinscheduler集群
一.简述 Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度系统.致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用.有 ...

随机推荐

APK文件结构和安装过程
APK文件结构Android应用是用Java编写的,利用Android SDK编译代码,并且把所有的数据和资源文件打包成一个APK (Android Package)文件,这是一个后缀名为.apk的压 ...
[codeforces743C]:Vladik and fractions（数学）
题目传送门题目描述请找出一组合法解使得$\frac{1}{x}+\frac{1}{y}+\frac{1}{z}=\frac{2}{n}$成立. 其中$x,y,z$为正整数且互不相同. 输入格式一 ...
vue中动态加载图片路径的方法
assets:在项目编译的过程中会被webpack处理解析为模块依赖,只支持相对路径的形式,如< img src=”./logo.png”>和background:url(./logo.p ...
JavaScript export
export The export statement is used when creating JavaScript modules to export functions, objects, o ...
React-Native 之 GD （二十一）APP 打包
1.生成一个签名密钥: 在 /android/app 下运行说明:keytool -genkey -v -keystore my-release-key.keystore -alias my-key ...
十五、jenkins环境配置
1. jenkins包下载,下载地址:https://jenkins.io/download/ 版本:Jenkins 2.134,下载war包 2. JDK下载:下载地址:http://www.ora ...
一个DRF框架的小案例
第一步:安装DRF DRF需要以下依赖: Python (2.7, 3.2, 3.3, 3.4, 3.5, 3.6) Django (1.10, 1.11, 2.0) DRF是以Django扩展应用的 ...
阶段1 语言基础+高级_1-3-Java语言高级_06-File类与IO流_01 File类_8_File类遍历(文件夹)目录功能
遍历这个目录下的文件遍历一个文件就会报错’ 不存在的路径,也会报空指针异常遍历可以获取到隐藏的文件夹和文件.常见一个隐藏的文件和文件夹 ListFiles私有类型的数组
HashTable 和 HashMap 区别
hashMap去掉了HashTable 的contains方法,但是加上了containsValue()和containsKey()方法. hashTable同步的,而HashMap是非同步的,效率上 ...
jmeter之三种参数化
前言:总结并记录几种jmeter比较有用的元件 1.接口文档 2.参数化 3.断言 1.接口文档 a.拿到接口文档接口地址:http://localhost:8080/jpress/admin/lo ...

CentOS7搭建Storm集群及基础操作

前提

Storm安装

下载

解压

移动文件夹

拷贝文件到其余工作节点

Storm操作

启动主控节点

启动主控节点管理界面

启动工作节点

访问地址

运行拓扑

删除拓扑

完整示例

CentOS7搭建Storm集群及基础操作的更多相关文章

随机推荐

热门专题