storm 001

Hadoop、Storm系统和组件接口对比表：

package storm;

import org.apache.storm.Config;

import org.apache.storm.StormSubmitter;

import org.apache.storm.generated.StormTopology;

import org.apache.storm.topology.TopologyBuilder;

/**

 * 组织各个处理组件形成一个完整的处理流程，就是所谓的topology(类似于mapreduce程序中的job)

 * 并且将该topology提交给storm集群去运行，topology提交到集群后就将永无休止地运行，除非人为或者异常退出

 */

public class TopoMain {//storm.TopoMain

	public static void main(String[] args) throws Exception {

		TopologyBuilder builder = new TopologyBuilder();

		// 将我们的spout组件设置到topology中去

		// parallelism_hint ：4 表示用4个excutor来执行这个组件

		// setNumTasks(8) 设置的是该组件执行时的并发task数量，也就意味着1个excutor会运行2个task

		builder.setSpout("randomspout", new RandomWordSpout(), 4).setNumTasks(8);

		// 将大写转换bolt组件设置到topology，并且指定它接收randomspout组件的消息

		// .shuffleGrouping("randomspout")包含两层含义：

		// 1、upperbolt组件接收的tuple消息一定来自于randomspout组件

		// 2、randomspout组件和upperbolt组件的大量并发task实例之间收发消息时采用的分组策略是随机分组shuffleGrouping

		builder.setBolt("upperbolt", new UpperBolt(), 4).shuffleGrouping("randomspout");

		// 将添加后缀的bolt组件设置到topology，并且指定它接收upperbolt组件的消息

		builder.setBolt("suffixbolt", new SuffixBolt(), 4).shuffleGrouping("upperbolt");

		// 用builder来创建一个topology

		StormTopology demotop = builder.createTopology();

		// 配置一些topology在集群中运行时的参数

		Config conf = new Config();

		// 这里设置的是整个demotop所占用的槽位数，也就是worker的数量

		conf.setNumWorkers(4);

		conf.setDebug(true);

		conf.setNumAckers(0);

		//System.setProperty("storm.jar", "/home/hadoop/storm.jar");

		// 将这个topology提交给storm集群运行

		StormSubmitter.submitTopology("demotopo2", conf, demotop);

		//Must submit topologies using the 'storm' client script so that StormSubmitter knows which jar to upload.

	}

}

 

-----------------------------------------------------------------------------------------------------------------

 

package storm; 

import java.util.Map;

import java.util.Random;

import org.apache.storm.spout.SpoutOutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichSpout;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Values;

public class RandomWordSpout extends BaseRichSpout {

	private SpoutOutputCollector collector;

	// 模拟一些数据

	String[] str = { "hello", "word", "you", "how", "are" };

	// 初始化方法，在spout组件实例化时调用一次

	@Override

	public void open(Map conf, TopologyContext context, SpoutOutputCollector collector) {

		this.collector = collector;

	}

	// 声明本spout组件发送出去的tuple中的数据的字段名

	@Override

	public void declareOutputFields(OutputFieldsDeclarer declarer) {

		declarer.declare(new Fields("orignname"));

	}

	@Override

	public void nextTuple() {

		// 随机挑选出一个名称

		Random random = new Random();

		int index = random.nextInt(str.length);

		// 获取名称

		String name = str[index];

		// 将名称进行封装成tuple，发送消息给下一个组件

		collector.emit(new Values(name));

	}

}

 

************************************************

package storm; 

import java.io.FileWriter;

import java.io.IOException;

import java.util.Map;

import java.util.UUID;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.BasicOutputCollector;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseBasicBolt;

import org.apache.storm.tuple.Tuple;

public class SuffixBolt extends BaseBasicBolt {

	FileWriter fileWriter = null;

	// 在bolt组件运行过程中只会被调用一次

	@Override

	public void prepare(Map stormConf, TopologyContext context) {

		try {

			fileWriter = new FileWriter("/home/hadoop/stormoutput2/" + UUID.randomUUID());

		} catch (IOException e) {

			throw new RuntimeException(e);

		}

	}

	// 该bolt组件的核心处理逻辑

	// 每收到一个tuple消息，就会被调用一次

	@Override

	public void execute(Tuple tuple, BasicOutputCollector collector) {

		// 先拿到上一个组件发送过来的名称

		String upper_name = tuple.getString(0);

		String suffix_name = upper_name + "_itisok";

		// 为上一个组件发送过来的商品名称添加后缀

		try {

			fileWriter.write(suffix_name);

			fileWriter.write("\n");

			fileWriter.flush();

		} catch (IOException e) {

			throw new RuntimeException(e);

		}

	}

	@Override

	public void declareOutputFields(OutputFieldsDeclarer declarer) {

		// TODO Auto-generated method stub

	}

}

 

 

 

***********************************************

package storm; 

import org.apache.storm.topology.BasicOutputCollector;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseBasicBolt;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Tuple;

import org.apache.storm.tuple.Values;

public class UpperBolt extends BaseBasicBolt {

	// 业务处理逻辑

	@Override

	public void execute(Tuple tuple, BasicOutputCollector collector) {

		// 先获取到上一个组件传递过来的数据,数据在tuple里面

		String godName = tuple.getString(0);

		// 将名称转换成大写

		String godName_upper = godName.toUpperCase();

		// 将转换完成的商品名发送出去

		collector.emit(new Values(godName_upper));

	}

	// 声明该bolt组件要发出去的tuple的字段

	@Override

	public void declareOutputFields(OutputFieldsDeclarer declarer) {

		declarer.declare(new Fields("uppername"));

	}

}


[root@alamps bin]# mkdir  /home/hadoop/stormoutput2

[root@alamps bin]# storm jar /home/hadoop/storm2.jar  storm.TopoMain

Running: /home/hadoop/app/jdk1..0_144/bin/java -client -Ddaemon.name= -Dstorm.options= -Dstorm.home=/home/hadoop/app/storm -Dstorm.log.dir=/home/hadoop/app/storm/logs -Djava.library.path=/usr/local/lib:/opt/local/lib:/usr/lib -Dstorm.conf.file= -cp /home/hadoop/app/storm/lib/storm-rename-hack-1.1..jar:/home/hadoop/app/storm/lib/log4j-core-2.8..jar:/home/hadoop/app/storm/lib/reflectasm-1.10..jar:/home/hadoop/app/storm/lib/log4j-over-slf4j-1.6..jar:/home/hadoop/app/storm/lib/minlog-1.3..jar:/home/hadoop/app/storm/lib/kryo-3.0..jar:/home/hadoop/app/storm/lib/objenesis-2.1.jar:/home/hadoop/app/storm/lib/disruptor-3.3..jar:/home/hadoop/app/storm/lib/storm-core-1.1..jar:/home/hadoop/app/storm/lib/servlet-api-2.5.jar:/home/hadoop/app/storm/lib/asm-5.0..jar:/home/hadoop/app/storm/lib/log4j-slf4j-impl-2.8..jar:/home/hadoop/app/storm/lib/log4j-api-2.8..jar:/home/hadoop/app/storm/lib/ring-cors-0.1..jar:/home/hadoop/app/storm/lib/slf4j-api-1.7..jar:/home/hadoop/app/storm/lib/clojure-1.7..jar:/home/hadoop/storm2.jar:/home/hadoop/app/storm/conf:/home/hadoop/app/storm/bin -Dstorm.jar=/home/hadoop/storm2.jar -Dstorm.dependency.jars= -Dstorm.dependency.artifacts={} storm.TopoMain

 [main] WARN  o.a.s.u.Utils - STORM-VERSION new 1.1. old null

 [main] INFO  o.a.s.StormSubmitter - Generated ZooKeeper secret payload for MD5-digest: -:-

 [main] INFO  o.a.s.u.NimbusClient - Found leader nimbus : alamps:

 [main] INFO  o.a.s.s.a.AuthUtils - Got AutoCreds []

 [main] INFO  o.a.s.u.NimbusClient - Found leader nimbus : alamps:

 [main] INFO  o.a.s.StormSubmitter - Uploading dependencies - jars...

 [main] INFO  o.a.s.StormSubmitter - Uploading dependencies - artifacts...

 [main] INFO  o.a.s.StormSubmitter - Dependency Blob keys - jars : [] / artifacts : []

 [main] INFO  o.a.s.StormSubmitter - Uploading topology jar /home/hadoop/storm2.jar to assigned location: /home/hadoop/app/storm/storm-local/nimbus/inbox/stormjar-408de160-c6d7-4d2c-895a-1416d94ea4a2.jar

 [main] INFO  o.a.s.StormSubmitter - Successfully uploaded topology jar to assigned location: /home/hadoop/app/storm/storm-local/nimbus/inbox/stormjar-408de160-c6d7-4d2c-895a-1416d94ea4a2.jar

 [main] INFO  o.a.s.StormSubmitter - Submitting topology demotopo2 in distributed mode with conf {"topology.acker.executors":,"storm.zookeeper.topology.auth.scheme":"digest","storm.zookeeper.topology.auth.payload":"-8576047804864739509:-7581013764627825431","topology.workers":,"topology.debug":true}

 [main] WARN  o.a.s.u.Utils - STORM-VERSION new 1.1. old 1.1.

 [main] INFO  o.a.s.StormSubmitter - Finished submitting topology: demotopo2

storm 001的更多相关文章

storm实战:基于storm,kafka,mysql的实时统计系统
公司对客户开放多个系统,运营人员想要了解客户使用各个系统的情况,在此之前,数据平台团队已经建设好了统一的Kafka消息通道. 为了保证架构能够满足业务可能的扩张后的性能要求,选用storm来处理各个应 ...
Kafka+Storm+HDFS整合实践
在基于Hadoop平台的很多应用场景中,我们需要对数据进行离线和实时分析,离线分析可以很容易地借助于Hive来实现统计分析,但是对于实时的需求Hive就不合适了.实时应用场景可以使用Storm,它是一 ...
参考storm中的RotatingMap实现key超时处理
storm0.8.1以后的RotatingMap完全可以独立于storm用来实现hashmap的key超时删除,并调用回调函数 RotatingMap.java: import java.util.H ...
Storm系列二： Storm拓扑设计
Storm系列二: Storm拓扑设计在本篇中,我们就来根据一个案例,看看如何去设计一个拓扑, 如何分解问题以适应Storm架构,同时对Storm拓扑内部的并行机制会有一个基本的了解. 本章代码都在 ...
Storm如何保证可靠的消息处理
作者:Jack47 PS:如果喜欢我写的文章,欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 本文主要翻译自Storm官方文档Guaranteeing messag ...
Storm
2016-11-14 22:05:29 有哪些典型的Storm应用案例? 数据处理流:Storm可以用来处理源源不断流进来的消息,处理之后将结果写入到某个存储中去.不像其它的流处理系统,Storm不 ...
Storm介绍(一)
作者:Jack47 PS:如果喜欢我写的文章,欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 内容简介本文是Storm系列之一,介绍了Storm的起源,Storm ...
理解Storm并发
作者:Jack47 PS:如果喜欢我写的文章,欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 注:本文主要内容翻译自understanding-the-parall ...
Storm构建分布式实时处理应用初探
最近利用闲暇时间,又重新研读了一下Storm.认真对比了一下Hadoop,前者更擅长的是,实时流式数据处理,后者更擅长的是基于HDFS,通过MapReduce方式的离线数据分析计算.对于Hadoop, ...

随机推荐

记录jq控制select 选中状态
$("#categoryId option[value='"+ data.category_id +"']").attr("selected" ...
json序列化以及反序列化存在多个对象时候的处理
存在多个对象的时候,只需要将反序列化存在的对象,遍历出来即可. using System;using System.Collections.Generic;using System.Linq;usin ...
Java、mysql、html、css、js 注释&大小写
java三种注释原文链接:https://www.cnblogs.com/miys/p/4bf714ce33068dcf9ac6526309c9b5e6.html 单行注释:// 注释内容多行注释 ...
java 集合（五）MapDemo
package cn.sasa.demo3; import java.util.HashMap; import java.util.Iterator; import java.util.LinkedH ...
MATLAB中产生随机数的那些函数
1.产生从imin~imax的m*n矩阵 randi([imin,imax],m,n); 2.产生1~n的无重复随机整数 randperm(n);
InnoDB Lock
众所周知innodb的锁是行级锁,这样说也没有问题,只是还可以细分而已.推荐阅读何登成大牛的博客http://hedengcheng.com/?p=771 innodb的锁有三种算法,分别如下: Re ...
MySQL模拟Oralce闪回操作
在前面的文章中我们介绍了MySQL误操作后数据恢复(update,delete忘加where条件),大概操作是通过sed命令把binlog中相关SQL误操作给逆向回来,然后导入SQL文件来恢复错误操作 ...
自定义PopView
改代码是参考一个Demo直接改的,代码中有一些漏洞,如果发现其他的问题,可以下方直接留言 .h文件 #import <UIKit/UIKit.h> typedef void(^Popove ...
20190228 搭建Hadoop基础环境
下载VMware 12 版本以上下载CentOS 7以上版本安装虚拟机,安装系统时,注意设置root 账号和密码虚拟机配置网络,命令ip addr 查看IP 地址,(配置网络网上有很多办法,百度 ...
(转)github设置添加SSH
很多朋友在用github管理项目的时候,都是直接使用https url克隆到本地,当然也有有些人使用 SSH url 克隆到本地.然而,为什么绝大多数人会使用https url克隆呢? 这是因为,使用 ...

storm 001

storm 001的更多相关文章

随机推荐

热门专题