大数据学习day31------spark11-------1. Redis的安装和启动，2 redis客户端 3.Redis的数据类型 4. kafka（安装和常用命令）5.kafka java客户端

1. Redis

　　Redis是目前一个非常优秀的key-value存储系统（内存的NoSQL数据库）。和Memcached类似，它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)、zset(sorted set有序集合)和hash（哈希类型）。

1.1 redis的安装（源码安装方式，官网供下载的redis，没有编译的，需要自己编译）

（1）下载redis4的稳定版本　　

（2）上传redis-4.0.14.tar.gz到Linux服务器

（3）解压redis源码包，至指定的位置

tar -zxvf redis-4.0.14.tar.gz -C /usr/local/src/    // 一般源码类放此文件夹，也可以自己选个位置

（4）进入到源码包中，编译

　　　cd /usr/local/src/redis-4.0.14/

　　　make

若报如下错：

没有安装C语言的环境，redis的开发语言为C

（5）在linux中安装C语言环境

有网的情况下

yum -y install gcc  // 有网的情况下

无网的情况，

　　配置本地yum源，具体见大数据学习day02

yum list | grep gcc    // 查看yum源中的gcc版本

安装C语言环境

yum -y install gcc gcc-c++

（7）重新编译

make

如果报如下错

解决办法：

make MALLOC=libc

（8）安装

make install

(9) 在/usr/local/下创建一个redis目录，然后拷贝redis自带的配置文件redis.conf到/usr/local/redis中

mkdir /usr/local/redis

cp /usr/local/src/redis-4.0.14/redis.conf /usr/local/redis

（10）.修改当前机器的配置文件redis.conf

bind 172.16.200.103 127.0.0.1

daemonize yes  #redis后台运行

requirepass 123456 #指定redis的密码

dir /data/redis #redis数据存储的位置

appendonly yes  #开启aof日志，它会每次写操作都记录一条日志

（11）启动redis节点

redis-server  /usr/local/redis/redis.conf

（12）查看redis进程状态

ps -ef | grep redis

如下，表示启动成功

（13）使用命令登录

redis-cli -h 192.168.57.11 -p 6379

此时需要验证密码，否则没有操作权限

auth feng

2 Redis客户端

2.1 redis自带的客户端

指定启动参数：-h；指定主机IP -p：指定主机端口；验证密码： auth 密码

Redis安装成功之后，默认有16个数据库（可在redis.conf文件中看到，如下图），每个库之间是互相独立的。

默认存储的数据是放到db0中的，切换数据库的命令：select 数据库编号

补充：

　　关闭redis的命令

2.2 java客户端

2.2.1 jedis介绍

　Redis不仅是使用命令来操作，现在基本上主流的语言都有客户端支持，比如java、C、C#、C++、php、Node.js、Go等。　　　

　在官方网站里列一些Java的客户端，有Jedis、Redisson、Jredis、JDBC-Redis、等其中官方推荐使用Jedis和Redisson。在企业中用的最多的就是Jedis，下面我们就重点学习下Jedis。

Jedis同样也是托管在github上，地址：https://github.com/xetorthio/jedis

2.2.2 搭建maven工程

创建一个maven project并导入jar包依赖。

添加pom依赖：

    <dependencies>

        <dependency>

            <groupId>redis.clients</groupId>

            <artifactId>jedis</artifactId>

            <version>3.0.1</version>

        </dependency>

    </dependencies>

3.2.3 单实例链接redis

public class RedisClient {

    public static void main(String[] args) {

        // 指定主机名和端口

        Jedis jedis = new Jedis("feng05", 6379);

        jedis.auth("feng");

        //选择使用哪个db，默认使用db0

        jedis.select(0);

        // 测试连通

        String ping = jedis.ping();

        System.out.println(ping);

        // 关闭链接

        jedis.close();

    }

}

3.2.3 使用连接池连接redis

public class RedisClient2 {

    public static void main(String[] args) {

        // 创建连接池

        JedisPool pool = new JedisPool("feng05", 6379);

        // 通过连接池获取jedis实例

        Jedis jedis1 = pool.getResource();

        Jedis jedis2 = pool.getResource();

        jedis1.auth("feng");

        jedis2.auth("feng");

        jedis1.set("name","zs");

        String name = jedis2.get("name");

        System.out.println(name);

    }

}

3.Redis的数据类型（见redis文档）　　

Redis中存储数据是通过key-value存储的，对于value的类型有以下几种：

在redis中的命令语句中，命令是忽略大小写的，而key是不忽略大小写的。

3.1 String数据类型操作

　删除所有的数据 flushdb ,注意慎用该命令　　　

（1）设置k-v：set key value

OK

127.0.0.1:6379> keys *

1) "name"

127.0.0.1:6379> get name

"zhangsan"

127.0.0.1:6379> set age 18

OK

127.0.0.1:6379> get age

"18"

（2）自增（incr），自减（decr），自增（减）指定数值(子增减的步长) : incrby decrby

127.0.0.1:6379> incr age

(integer) 19

127.0.0.1:6379> incr name

(error) ERR value is not an integer or out of range

自增指定数值（自增的步长） incrby decrby

127.0.0.1:6379>incrby age 2

(integer) 21

（3）删除: del　

127.0.0.1:6379> del name

(integer) 1

127.0.0.1:6379> del xxx

(integer) 0

（4）同时设置，获取多个键值

语法：

MSET key value [key value …]

MGET key [key …]

如

127.0.0.1:6379> mset k1 v1 k2 v2 k3 v3

OK

127.0.0.1:6379> get k1

"v1"

127.0.0.1:6379> mget k1 k3

1) "v1"

2) "v3"

（5）STRLEN命令返回键值的长度，如果键不存在则返回0 ：STRLEN key

127.0.0.1:6379> strlen str

(integer) 0

127.0.0.1:6379> set str hello

OK

127.0.0.1:6379> strlen str

(integer) 5

4.kafka

4.1 Kafka的概念　　

（1）Broker：安装了kafka的服务器

（2）Topic：主题，数据的分类，类似数据库中的表

（3）partition：分区，分区越多，并发能力越强，单个分区内的数据是有序的，若同一个broker中有多个leader分区，多个分区中的数据整体并不是有序的。分区的leader分区和folower由zk选举　　

　　 leader分区负责读写（生产者和消费者连到Leader分区，folower分区负责同步数据）

（4）replication：副本，将数据存储多份，保证数据不丢

（5）Producer：消息的生产者，将数据发送到指定topic的leader分区

（6）Consumer：消息的消费者，从指定Topic的leader分区拉取数据，消费者会管理偏移量（记录数据读取到什么地方，避免数据重复消费）

（7）Consumer Group：消费者组，一个组中可以有多个消费者，数据不会重复消费

4.2 Kafka集群架构图

不同消费者组中的消费者可以消费同一个分区的数据，他们互不影响（各自记录各自的偏移量，都可以读取该分区内的所有数据）

总结：

.Kafka的生成者直接向Broker的Leader分区写入数据，不需要连接ZK

.Kafka的消费者(老的API需要先连接ZK，获取Broker信息和偏移量信息)，新的API不需要连接ZK(直连方式，效率更高)

4.3 kafka集群的安装

前提：安装zookeeper，并启动

（1）上传kafka安装包，解压到自己想要的地址

（2）修改配置文件

#指定broker的id

broker.id=1

#数据存储的目录

log.dirs=/data/kafka

#指定zk地址

zookeeper.connect=feng05:2181,feng06:2181,feng07:2181

#可以删除topic的数据(一般测试的时候才配置此)

delete.topic.enable=true

（3）将配置好的kafka拷贝到其他节点

[root@feng05 apps]# scp -r kafka_2.11-1.1.1 feng06:$PWD

（4）修改其他节点Kafka的broker.id

（5）在所有节点启动kafka

/usr/apps/kafka_2.11-1.1.1/bin/kafka-server-start.sh -daemon /usr/apps/kafka_2.11-1.1.1/config/server.properties

注意：此处不加-daemon的话，开启kafka是以守护进程的形式开启，加上-daemon就是以后台的形式开启kafka

（6）查看启动是否成功

至此安装完毕

4.4 一些简单命令

（1）查看kafka的topic

/usr/apps/kafka_2.11-1.1.1/bin/kafka-topics.sh --list --zookeeper localhost:2181

（2）创建topic

/usr/apps/kafka_2.11-1.1.1/bin/kafka-topics.sh --zookeeper feng05:2181 --create --topic wordcount --replication-factor 3 --partitions 3

（3）启动一个命令行生产者

/usr/apps/kafka_2.11-1.1.1/bin/kafka-console-producer.sh --broker-list feng05:9092,feng06:9092,feng07:9092 --topic wordcount

（4）启动一个命令消费者

/usr/apps/kafka_2.11-1.1.1/bin/kafka-console-consumer.sh --bootstrap-server feng05:9092 --topic wordcount --from-beginning

--from-beginning 消费以前产生的所有数据，如果不加，就是消费消费者启动后产生的数据

（5）删除topic（只有配置文件配置了可以删除topic，此操作才有用）

/usr/apps/kafka_2.11-1.1.1/bin/kafka-topics.sh --delete --topic wordcount --zookeeper localhost:2

(6) 查看topic详细信息

/usr/apps/kafka_2.11-1.1.1/bin/kafka-topics.sh --zookeeper localhost:2181 --describe --topic wordcount

分区的详细信息

(7) 查看某个topic的偏移量

/usr/apps/kafka_2.11-1.1.1/bin/kafka-console-consumer.sh --topic __consumer_offsets  --bootstrap-server feng05:9092,feng06:9092,feng07:9092  --formatter "kafka.coordinator.group.GroupMetadataManager\$OffsetsMessageFormatter" --consumer.config config/consumer.properties --from-beginning

5.kafka java客户端

前提：导入kafka的依赖

<dependency>

    <groupId>org.apache.kafka</groupId>

    <artifactId>kafka-clients</artifactId>

    <version>1.1.1</version>

</dependency>

5.1 生产者

package cn._51doit.kafka.clients

import java.util.{Properties, UUID}

import org.apache.kafka.clients.producer.{KafkaProducer, ProducerRecord}

import org.apache.kafka.common.serialization.StringSerializer

object ProducerDemo {

  def main(args: Array[String]): Unit = {

    // 1 配置参数

    val props = new Properties()

    // 连接kafka节点

    props.setProperty("bootstrap.servers", "node-1.51doit.cn:9092,node-2.51doit.cn:9092,node-3.51doit.cn:9092")

    //指定key序列化方式

    props.setProperty("key.serializer", "org.apache.kafka.common.serialization.StringSerializer")

    //指定value序列化方式

    props.setProperty("value.serializer", classOf[StringSerializer].getName) // 两种写法都行

    val topic = "wordcount"

    // 2 kafka的生产者

    val producer: KafkaProducer[String, String] = new KafkaProducer[String, String](props)

    for (i <- 41 to 50) {

      // 3 封装的对象

      //将数据发送到指定的分区编号

      //val record = new ProducerRecord[String, String](topic, 1 , "abc","myvalue:"+i)

      //val partitionNum = i % 4  // 指定数据均匀写入4个分区中

      //val record = new ProducerRecord[String, String](topic, partitionNum, null,"myvalue:"+i)

      //不指定分区编号，指定key，   分区编号 = key.hasacode % 4

      //val record = new ProducerRecord[String, String](topic , "abc","myvalue:"+i)

      //根据key的hashcode值模除以topic分区的数量，返回一个分区编号

      //val record = new ProducerRecord[String, String](topic , UUID.randomUUID().toString ,"myvalue:"+i)

      //没有指定Key和分区，默认的策略就是轮询，将数据均匀写入多个分区中

      val record = new ProducerRecord[String, String](topic,"value-" + i)

      // 4 发送消息

      producer.send(record)

    }

    println("message send success")

    // 释放资源

    producer.close()

  }

}

5.2 消费者

package cn._51doit.kafka.clients

import java.util

import java.util.Properties

import org.apache.kafka.clients.consumer.{ConsumerRecords, KafkaConsumer}

import org.apache.kafka.common.serialization.StringDeserializer

object ConsumerDemo {

  def main(args: Array[String]): Unit = {

    // 1 配置参数

    val props = new Properties()

    //从哪些broker消费数据

    props.setProperty("bootstrap.servers", "node-1.51doit.cn:9092,node-2.51doit.cn:9092,node-3.51doit.cn:9092")

    // 反序列化的参数

    props.setProperty("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer")

    props.setProperty("value.deserializer",classOf[StringDeserializer].getName)

    // 指定group.id

    props.setProperty("group.id","g101")

    // 指定消费的offset从哪里开始

    //earliest：从头开始 --from-beginning

    //latest:从消费者启动之后

    props.setProperty("auto.offset.reset","earliest") //[latest, earliest, none]

    // 是否自动提交偏移量  offset

    // enable.auto.commit 默认值就是true【5秒钟更新一次】，消费者定期会更新偏移量 groupid,topic,parition -> offset

    // props.setProperty("enable.auto.commit","false") // kafka自动维护偏移量     手动维护偏移量

    //enable.auto.commit   5000

    // 2 消费者的实例对象

    val consumer: KafkaConsumer[String, String] = new KafkaConsumer[String, String](props)

    // 订阅   参数类型  java的集合

    val topic: util.List[String] = java.util.Arrays.asList("wordcount")

    // 3 订阅主题

    consumer.subscribe(topic)

    while (true){

      // 4  拉取数据

      val msgs: ConsumerRecords[String, String] = consumer.poll(2000)

      import scala.collection.JavaConversions._

      for(cr <- msgs){

//        ConsumerRecord[String, String]

          println(cr)

      }

    }

    //consumer.close()

  }

}

大数据学习day31------spark11-------1. Redis的安装和启动，2 redis客户端 3.Redis的数据类型 4. kafka（安装和常用命令）5.kafka java客户端的更多相关文章

大数据学习day15----第三阶段----scala03--------1.函数（“_”的使用, 函数和方法的区别）2. 数组和集合常用的方法（迭代器，并行集合） 3. 深度理解函数 4 练习（用java实现类似Scala函数式编程的功能（不能使用Lambda表达式））
1. 函数函数就是一个非常灵活的运算逻辑,可以灵活的将函数传入方法中,前提是方法中接收的是类型一致的函数类型函数式编程的好处:想要做什么就调用相应的方法(fliter.map.groupBy.so ...
大数据学习：storm流式计算
Storm是一个分布式的.高容错的实时计算系统.Storm适用的场景: 1.Storm可以用来用来处理源源不断的消息,并将处理之后的结果保存到持久化介质中. 2.由于Storm的处理组件都是分布式的, ...
java 与大数据学习较好的网站
C# C#中 Thread,Task,Async/Await,IAsyncResult 的那些事儿!https://www.cnblogs.com/doforfuture/p/6293926.html ...
大数据学习路线，来qun里分享干货，
一.Linux lucene: 全文检索引擎的架构 solr: 基于lucene的全文搜索服务器,实现了可配置.可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面. 推荐一个大数据学习群 ...
大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机)
引言在大数据学习系列之一 ----- Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 ----- HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用 ...
大数据学习系列之五 ----- Hive整合HBase图文详解
引言在上一篇大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机) 和之前的大数据学习系列之二 ----- HBase环境搭建(单机) 中成功搭建了Hive和HBase的环 ...
大数据学习系列之六 ----- Hadoop+Spark环境搭建
引言在上一篇中大数据学习系列之五 ----- Hive整合HBase图文详解 : http://www.panchengming.com/2017/12/18/pancm62/ 中使用Hive整合 ...
大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解
引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...
大数据学习系列之九---- Hive整合Spark和HBase以及相关测试
前言在之前的大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建中介绍了集群的环境搭建,但是在使用hive进行数据查询的时候会非常的慢,因为h ...

随机推荐

hdu 2199 Can you solve this equation?（二分法求多项式解）
题意给Y值,找到多项式 8*x^4 + 7*x^3 + 2*x^2 + 3*x + 6 == Y 在0到100之间的解. 思路从0到100,多项式是单调的,故用二分法求解. 代码 double c ...
Win10自动备份oracle数据库
1.环境操作系统:win10 数据库: 2.创建backup.bat文件 [ @echo offset name=%date:~0,4%%date:~5,2%%date:~8,2%set backu ...
java 三大特性_继承、封装、多态_day005
一.继承: java的三大特性之一.两个类之间通过extends关键字来描述父子关系,子类便可拥有父类的公共方法和公共属性.子类可以继承父类的方法和属性,子类也可以自己定义没有的方法或者通过覆盖父类的 ...
FZU ICPC 2020 寒假训练 3
P1308 统计单词数题目描述一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数.现在,请你编程实现这一功能,具体要求是:给定一 ...
Java 初始化与清理
用构造器确保初始化如何自定义构造器(constructor)? 构造器方法的名称与类名相同,并且没有返回值. 需要注意,在定义构方法时,方法名前面不要添加任何的类型说明符,格式:类名(){},构造方 ...
[bzoj2743]采花
预处理出每一个点下一个相同颜色的位置,记为next,然后将询问按左端点排序后不断右移左指针,设要删除i位置,就令f[next[next[i]]+1,同时还要删除原来的标记,即令f[next[i]]-1 ...
【Tool】MySQL安装
MySQL安装 2019-11-07 14:30:32 by冲冲本机 Windows7 64bit,MySQL是 mysql-8.0.18-winx64.zip. 1.官网下载 https:// ...
【程序员翻身计划】Java高性能编程第一章-Java多线程概述
目标重点: 线程安全的概念线程通信的方式与应用 reactor线程模型线程数量的优化 jdk常用命令 Netty框架的作用难点 java运行的原理同步关键字的原理 AQS的抽象 JUC的源码 ...
Codeforces 1175F - The Number of Subpermutations（线段树+单调栈+双针/分治+启发式优化）
Codeforces 题面传送门 & 洛谷题面传送门由于这场的 G 是道毒瘤题,蒟蒻切不动就只好来把这场的 F 水掉了看到这样的设问没人想到这道题吗?那我就来发篇线段树+单调栈的做法. 首 ...
Codeforces 582D - Number of Binominal Coefficients（Kummer 定理+数位 dp）
Codeforces 题目传送门 & 洛谷题目传送门一道数论与数位 dp 结合的神题 %%% 首先在做这道题之前你需要知道一个定理:对于质数 \(p\) 及 \(n,k\),最大的满足 \( ...

大数据学习day31------spark11-------1. Redis的安装和启动，2 redis客户端 3.Redis的数据类型 4. kafka（安装和常用命令）5.kafka java客户端

大数据学习day31------spark11-------1. Redis的安装和启动，2 redis客户端 3.Redis的数据类型 4. kafka（安装和常用命令）5.kafka java客户端的更多相关文章

随机推荐

热门专题