《OD大数据实战》Kafka入门实例
官网:
参考文档:
一、安装zookeeper
1. 下载zookeeper-3.4.5-cdh5.3.6.tar.gz
下载地址为: http://archive.cloudera.com/cdh5/cdh/5/
2. 解压到/opt/modules/cdh目录
tar -zxvf zookeeper-3.4.-cdh5.3.6.tar.gz -C /opt/modules/
3. 修改配置
cd /opt/modules/cdh/zookeeper-3.4.-cdh5.3.6 mkdir dataDir cd conf mv zoo_sample.cfg zoo.cfg vi zoo.cfg
修改内容
dataDir=/opt/modules/cdh/zookeeper-3.4.-cdh5.3.6/dataDir
4. 启动zookeeper
cd /opt/modules/cdh/zookeeper-3.4.-cdh5.3.6
bin/zkServer.sh start
5. 使用jps命令查看是否成功启动
启动成功,会有QuorumPeerMain进程
二、安装kafka
1. 下载 kafka_2.11-0.10.0.0.tgz
下载地址为https://www.apache.org/dyn/closer.cgi?path=/kafka/0.10.0.0/kafka_2.11-0.10.0.0.tgz
2. 解压
解压 kafka_2.11-0.10.0.0.tgz到/opt/modules目录
3. 修改配置
mkdir -p /opt/modules/kafka_2.11-0.10.0.0/dataDir
vi server.properties
修改内容:
log.dirs=/opt/modules/kafka_2.11-0.10.0.0/dataDir
zookeeper.connect=beifeng-hadoop-02:2181
4. 启动kafka
以后台进程方式启动kafka
nohup bin/kafka-server-start.sh config/server.properties >~/kafka-start.log >& &
5. 使用jps查看是否成功启动
启动成功能看到Kafka进程
ps -ef | grep kafka
netstat -tlnup | grep
三、单broker模拟生产者和消费者
1. 创建topic
创建一个叫"test"的topic,只有一个分区,一个副本
bin/kafka-topics.sh --create --zookeeper beifeng-hadoop-: --replication-factor --partitions --topic test
2. 通过list命令查看创建的topic
bin/kafka-topics.sh --list --zookeeper beifeng-hadoop-:
3. 发送消息
bin/kafka-console-producer.sh --broker-list beifeng-hadoop-: --topic test
4. 接收消息
bin/kafka-console-consumer.sh --zookeeper beifeng-hadoop-: --topic test --from-beginning
四、搭建一个多broker的集群
1. 修改配置
cp config/server.properties config/server1.properties
cp config/server.properties config/server2.properties
server1.properties内容修改:
broker.id=1
port=9093
log.dir=/opt/modules/kafka_2.11-0.10.0.0/dataDirServer1
server2.properties内容修改:
broker.id=2
port=9094
log.dir=/opt/modules/kafka_2.11-0.10.0.0/dataDirServer2
2. 启动服务器
nohup bin/kafka-server-start.sh config/server1.properties >~/kafka-server1-start.log >& & nohup bin/kafka-server-start.sh config/server2.properties >~/kafka-server2-start.log >& &
3. 创建有3个副本的topic
bin/kafka-topics.sh --create --zookeeper beifeng-hadoop-: --replication-factor --partitions --topic my-replicated-topic
4. 查看topic信息
bin/kafka-topics.sh --describe --zookeeper beifeng-hadoop-: --topic my-replicated-topic
Topic:my-replicated-topic PartitionCount:1 ReplicationFactor:3 Configs:
Topic: my-replicated-topic Partition: 0 Leader: 2 Replicas: 2,1,0 Isr: 2,1,0
解释一下这些输出。第一行是对所有分区的一个描述,然后每个分区都会对应一行,因为我们只有一个分区所以下面就只加了一行。
leader:负责处理消息的读和写,leader是从所有节点中随机选择的.
replicas:列出了所有的副本节点,不管节点是否在服务中.
isr:是正在服务中的节点.
在我们的例子中,节点1是作为leader运行。
5. 生产者
bin/kafka-console-producer.sh --broker-list beifeng-hadoop-: --topic my-replicated-topic
6. 消费者
bin/kafka-console-consumer.sh --zookeeper beifeng-hadoop-: --from-beginning --topic my-replicated-topic
《OD大数据实战》Kafka入门实例的更多相关文章
- 《OD大数据实战》HDFS入门实例
一.环境搭建 1. 下载安装配置 <OD大数据实战>Hadoop伪分布式环境搭建 2. Hadoop配置信息 1)${HADOOP_HOME}/libexec:存储hadoop的默认环境 ...
- 《OD大数据实战》驴妈妈旅游网大型离线数据电商分析平台
一.环境搭建 1. <OD大数据实战>Hadoop伪分布式环境搭建 2. <OD大数据实战>Hive环境搭建 3. <OD大数据实战>Sqoop入门实例 4. &l ...
- 《OD大数据实战》Hive环境搭建
一.搭建hadoop环境 <OD大数据实战>hadoop伪分布式环境搭建 二.Hive环境搭建 1. 准备安装文件 下载地址: http://archive.cloudera.com/cd ...
- 《OD大数据实战》环境整理
一.关机后服务重新启动 1. 启动hadoop服务 sbin/hadoop-daemon.sh start namenode sbin/hadoop-daemon.sh start datanode ...
- 《OD大数据实战》Hive入门实例
官方参考文档:https://cwiki.apache.org/confluence/display/Hive/LanguageManual 一.命令行和客户端 1. 命令窗口 1)进入命令窗口 hi ...
- 《OD大数据实战》Sqoop入门实例
官网地址: http://archive.cloudera.com/cdh5/cdh/5/sqoop-1.4.5-cdh5.3.6/SqoopUserGuide.html 一.环境搭建 1. 下载 s ...
- 《OD大数据实战》Flume入门实例
一.netcat source + memory channel + logger sink 1. 修改配置 1)修改$FLUME_HOME/conf下的flume-env.sh文件,修改内容如下 e ...
- 《OD大数据实战》Mahout入门实例
一.环境搭建 1. 下载 mahout-0.9-cdh5.3.6.tar.gz 2. 解压 3. mahout org.apache.mahout.clustering.syntheticcontro ...
- 《OD大数据实战》Spark入门实例
一.环境搭建 1. 编译spark 1.3.0 1)安装apache-maven-3.0.5 2)下载并解压 spark-1.3.0.tgz 3)修改make-distribution.sh VER ...
随机推荐
- 用fscanf()从文件取数据时,如何判断文件结束
例子:从键盘输入若干行字符(每行长度不等),输入后把它们存储到一磁盘文件中.再从该文件中读入这些数据,将其中小写字母转换成大写字母后再显示屏上输出. 有两种方法 1.使用feof()函数 #inclu ...
- awk 统计数据在文件中的出现次数
突然发现awk原来可以统计同一数据在要处理的文件中所出现的次数.原来的时候为了分析数据还自己写程序,哎,无语,当时还以为自己多强,手工分析不过来的东西写程序处理.现在想来实在是年少轻狂.解决问题嘛,不 ...
- python 安装 管理包 pip
2.7的坑里出不来了,现在已经换到3.4了,不存在下列问题. win7下安装pip http://blog.chinaunix.net/uid-24984661-id-4202194.html ...
- SPL学习 迭代器
主要学习内容: 慕课网的spl视频教程 阮一峰SPL学习笔记 http://www.ruanyifeng.com/blog/2008/07/php_spl_notes.html SPL类详解 http ...
- 使用时间戳引入css、js文件
前言 最近在一家创业公司实习,主要负责新版官网和商家平台管理系统的前端开发和维护,每次测试都要上传文件到ftp服务器端测试,初期由于更新修改比较频繁,每次都是直接上传覆盖css.js.php文件,链接 ...
- 相对布局RelativeLayout
一. public class RelativeLayout extends ViewGroup java.lang.Object ↳ android.view.View ↳ an ...
- HDFS2.x之RPC流程分析
HDFS2.x之RPC流程分析 1 概述 Hadoop提供了一个统一的RPC机制来处理client-namenode, namenode-dataname,client-dataname之间的通信.R ...
- 基于Eclipse的scala应用开发
原创文章,转载请注明: 转载自www.cnblogs.com/tovin/p/3823968.html 为了更好的学习scala语言,本文介绍如何基于Maven来构建scala项目 1.首先参照www ...
- [RM HA4] RM状态存储与还原原理详解
RM状态存储与还原机制详解 转载请注明原始链接http://www.cnblogs.com/shenh062326/p/3562199.html. 摘要 本文基于Apache Hadoop社区最新re ...
- lintcode : 跳跃游戏
跳跃游戏 给出一个非负整数数组,你最初定位在数组的第一个位置. 数组中的每个元素代表你在那个位置可以跳跃的最大长度. 判断你是否能到达数组的最后一个位置. 样例 A = [2,3,1,1,4],返回 ...