Flink部署-standalone模式

2018年11月30日 00:07:41 Xlucas 阅读数：74

安装环境信息

flink-1.6.2-bin-hadoop27-scala_2.11.tgz

hadoop-2.7.5

java 1.8

zookeeper 3.4.6

os:centos 6.4

1、下载
直接去flink的社区下载就可以了。http://flink.apache.org/downloads.html
2、解压

 tar -zxvf flink-1.6.2-bin-hadoop27-scala_2.11.tgz

3、修改环境变量 ~.bash_profile

export FLINK_HOME=/opt/flink-1.6.2

export PATH=$FLINK_HOME/bin:$PATH

4、修改flink-conf.yaml配置文件，先配置一个简单版本，standalone的模式

Hadoop的nameservice

jobmanager.rpc.address: cdh1

jobmanager.rpc.port: 6123

jobmanager.heap.size: 1024m

taskmanager.heap.size: 1024m

taskmanager.numberOfTaskSlots: 4

parallelism.default: 12

5、修改slaves和masters2个文件，用来配置taskManager和JobManager信息

[hadoop@cdh1 conf]$ cat slaves

cdh2

cdh3

cdh4

cdh5

[hadoop@cdh1 conf]$ cat masters

cdh1:8081

6、将flink安装所有信息已经环境信息同步到其他机器上面，这里有几台机器就要执行几次

scp .bash_profile hadoop@cdh3:~/.bash_profile

scp -r ./flink-1.6.2 hadoop@cdh3:/opt/

7、启动flink
[hadoop@cdh1 bin]$ ./start-cluster.sh
8、启动完成已经我们可以用jps。分别可以看到JobManager和TaskManager的2个进程

[hadoop@cdh1 bin]$ jps

3866 StandaloneSessionClusterEntrypoint

[hadoop@cdh2 ~]$ jps

3534 TaskManagerRunner

8、登录JobManager的地址查看ui http://192.168.18.160:8081

已经表示搭建完成了，现在我们开始验证一下集群

使用start-scala-shell.sh来验证
${FLINK_HOME}/bin/start-scala-shell.sh是flink提供的交互式clinet,可以用于代码片段的测试，方便开发工作，它有两种启动方式，一种是工作在本地，另一种是工作到集群。本例中因为机器连接非常方便，就直接使用集群进行测试，在开发中，如果集群连接不是非常方便，可以连接到本地，在本地开发测试通过后，再连接到集群进行部署工作。如果程序有依赖的jar包，则可以使用 -a <path/to/jar.jar> 或 --addclasspath <path/to/jar.jar>参数来添加依赖。

1.本地连接

${FLINK_HOME}/bin/start-scala-shell.sh local

2.集群连接

${FLINK_HOME}/bin/start-scala-shell.sh remote <hostname> <portnumber>

3.带有依赖包的格式

${FLINK_HOME}/bin/start-scala-shell.sh [local|remote<host><port>] --addclasspath<path/to/jar.jar>

4.查看帮助

${FLINK_HOME}/bin/start-scala-shell.sh --help

[hadoop@cdh2 bin]$ ./start-scala-shell.sh --help

Flink Scala Shell

Usage: start-scala-shell.sh [local|remote|yarn] [options] <args>...

Command: local [options]

Starts Flink scala shell with a local Flink cluster

  -a, --addclasspath <path/to/jar>

                           Specifies additional jars to be used in Flink

Command: remote [options] <host> <port>

Starts Flink scala shell connecting to a remote cluster

  <host>                   Remote host name as string

  <port>                   Remote port as integer

  -a, --addclasspath <path/to/jar>

                           Specifies additional jars to be used in Flink

Command: yarn [options]

Starts Flink scala shell connecting to a yarn cluster

  -n, --container arg      Number of YARN container to allocate (= Number of TaskManagers)

  -jm, --jobManagerMemory arg

                           Memory for JobManager container

  -nm, --name <value>      Set a custom name for the application on YARN

  -qu, --queue <arg>       Specifies YARN queue

  -s, --slots <arg>        Number of slots per TaskManager

  -tm, --taskManagerMemory <arg>

                           Memory per TaskManager container

  -a, --addclasspath <path/to/jar>

                           Specifies additional jars to be used in Flink

  --configDir <value>      The configuration directory.

  -h, --help               Prints this usage text

我们使用集群模式去验证

[hadoop@cdh1 bin]$ ./start-scala-shell.sh remote 192.168.18.160 8081

运行如下案例代码

Scala> val text = benv.fromElements(

  "To be, or not to be,--that is the question:--",

  "Whether 'tis nobler in the mind to suffer",

  "The slings and arrows of outrageous fortune",

  "Or to take arms against a sea of troubles,")

Scala> val counts = text

    .flatMap { _.toLowerCase.split("\\W+") }

    .map { (_, 1) }.groupBy(0).sum(1)

Scala> counts.print()

运行结果

web url也可以看到详细的信息

遇到异常情况：
我们这边是因为安装了Scala导致通信失败，将Scala的环境信息去掉就可以了。具体问题还不是很清楚，待后续查明白。

java.net.ConnectException: Connection refused (Connection refused)

        at java.net.PlainSocketImpl.socketConnect(Native Method)

        at java.net.AbstractPlainSocketImpl.doConnect(AbstractPlainSocketImpl.java:350)

        at java.net.AbstractPlainSocketImpl.connectToAddress(AbstractPlainSocketImpl.java:206)

        at java.net.AbstractPlainSocketImpl.connect(AbstractPlainSocketImpl.java:188)

        at java.net.SocksSocketImpl.connect(SocksSocketImpl.java:392)

        at java.net.Socket.connect(Socket.java:589)

        at org.apache.flink.streaming.api.functions.source.SocketTextStreamFunction.run(SocketTextStreamFunction.java:96)

        at org.apache.flink.streaming.api.operators.StreamSource.run(StreamSource.java:94)

        at org.apache.flink.streaming.api.operators.StreamSource.run(StreamSource.java:58)

        at org.apache.flink.streaming.runtime.tasks.SourceStreamTask.run(SourceStreamTask.java:99)

        at org.apache.flink.streaming.runtime.tasks.StreamTask.invoke(StreamTask.java:300)

        at org.apache.flink.runtime.taskmanager.Task.run(Task.java:711)

        at java.lang.Thread.run(Thread.java:745)

2018-11-19 01:49:52,298 INFO  org.apache.flink.runtime.executiongraph.ExecutionGraph

 - Job Socket Window WordCount (8b38f995aa8e61fd520b61e0888ecd46) switched from state RUNNING to FAILING.

java.net.ConnectException: Connection refused (Connection refused)

        at java.net.PlainSocketImpl.socketConnect(Native Method)

        at java.net.AbstractPlainSocketImpl.doConnect(AbstractPlainSocketImpl.java:350)

        at java.net.AbstractPlainSocketImpl.connectToAddress(AbstractPlainSocketImpl.java:206)

        at java.net.AbstractPlainSocketImpl.connect(AbstractPlainSocketImpl.java:188)

        at java.net.SocksSocketImpl.connect(SocksSocketImpl.java:392)

        at java.net.Socket.connect(Socket.java:589)

        at org.apache.flink.streaming.api.functions.source.SocketTextStreamFunction.run(SocketTextStreamFunction.java:96)

        at org.apache.flink.streaming.api.operators.StreamSource.run(StreamSource.java:94)

        at org.apache.flink.streaming.api.operators.StreamSource.run(StreamSource.java:58)

        at org.apache.flink.streaming.runtime.tasks.SourceStreamTask.run(SourceStreamTask.java:99)

        at org.apache.flink.streaming.runtime.tasks.StreamTask.invoke(StreamTask.java:300)

        at org.apache.flink.runtime.taskmanager.Task.run(Task.java:711)

Flink部署-standalone模式的更多相关文章

Standalone模式下，通过Systemd管理Flink1.11.1的启停及异常退出
Flink以Standalone模式运行时,可能会发生jobmanager(以下简称jm)或taskmanager(以下简称tm)异常退出的情况,我们可以使用Linux自带的Systemd方式管理jm ...
Flink JobManager HA模式部署（基于Standalone）
参考文章:https://ci.apache.org/projects/flink/flink-docs-release-1.3/setup/jobmanager_high_availability. ...
flink部署操作-flink standalone集群安装部署
flink集群安装部署 standalone集群模式必须依赖必须的软件 JAVA_HOME配置 flink安装配置flink 启动flink 添加Jobmanager/taskmanager 实 ...
Spark运行模式与Standalone模式部署
上节中简单的介绍了Spark的一些概念还有Spark生态圈的一些情况,这里主要是介绍Spark运行模式与Spark Standalone模式的部署: Spark运行模式在Spark中存在着多种运行模 ...
Spark部署三种方式介绍：YARN模式、Standalone模式、HA模式
参考自:Spark部署三种方式介绍:YARN模式.Standalone模式.HA模式http://www.aboutyun.com/forum.php?mod=viewthread&tid=7 ...
Spark安装部署（local和standalone模式）
Spark运行的4中模式: Local Standalone Yarn Mesos 一.安装spark前期准备 1.安装java $ sudo tar -zxvf jdk-7u67-linux-x64 ...
Flink架构分析之Standalone模式启动流程
概述 FLIP6 对Flink架构进行了改进,引入了Dispatcher组件集成了所有任务共享的一些组件:SubmittedJobGraphStore,LibraryCacheManager等,为了保 ...
【Spark】Spark的Standalone模式安装部署
Spark执行模式 Spark 有非常多种模式,最简单就是单机本地模式,还有单机伪分布式模式,复杂的则执行在集群中,眼下能非常好的执行在 Yarn和 Mesos 中.当然 Spark 还有自带的 St ...
spark运行模式之二：Spark的Standalone模式安装部署
Spark运行模式 Spark 有很多种模式,最简单就是单机本地模式,还有单机伪分布式模式,复杂的则运行在集群中,目前能很好的运行在 Yarn和 Mesos 中,当然 Spark 还有自带的 Stan ...

随机推荐

Web项目发布后字体文件找不到
一.问题 ①ASP.NET项目,开发工具Visual Studio ②在IIS上发布之后,网页控制台报错,某某文件找不到,但是在服务器文件夹中看明明有那个文件二.解决方法 ①>>打开II ...
【公众号系列】超详细SAP HANA JOB全解析
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[公众号系列]超详细SAP HANA JOB全解 ...
CFS调度器（1）-基本原理
首先需要思考的问题是:什么是调度器(scheduler)?调度器的作用是什么?调度器是一个操作系统的核心部分.可以比作是CPU时间的管理员.调度器主要负责选择某些就绪的进程来执行.不同的调度器根据不同 ...
Chrome浏览器清除缓存
1.功能列表点击历史记录可以是按时间清除自动清除: 使用谷歌的无痕模式可以自动清除缓存
LeetCode算法题-Base 7（Java实现）
这是悦乐书的第247次更新,第260篇原创 01 看题和准备今天介绍的是LeetCode算法题中Easy级别的第114题(顺位题号是504).给定一个整数,返回其基数为7的字符串表示.例如: 输入: ...
HTML5存储技术Storage
前端存储技术localStorage是永久存储sessionStorage是一次会话存储 localStorage只支持string类型的存储存进去的所有类型, 取出来之后都变成了string. 一 ...
redis Lua学习与坑
1.在写lua脚本往redis中添加zadd 有序集合的时候一直报 "value is not a valid float"的错误,经过查询相关资料,最后发现,是顺序写反了. 相关 ...
SQL 约束 (Constraints)
SQL 约束约束用于限制加入表的数据的类型. 可以在创建表时规定约束(通过 CREATE TABLE 语句),或者在表创建之后也可以(通过 ALTER TABLE 语句). 我们将主要探讨以下几种约 ...
DeeplabV3+ 训练自己的遥感数据
一.预处理数据部分 1.创建 tfrecord(修改 deeplab\ dateasets\ build_data.py) 模型本身是把一张张 jpg 和 png 格式图片读到一个 Example 里 ...
SQL Server中NULL的一个测试
我们都知道SQL Server中NULL是一个很特殊的存在,因为NULL不会等于任何值,且NULL也不会不等于任何值.对于NULL我们只能使用IS或IS NOT关键字来进行比较. 我们先来看看下面一个 ...

Flink部署-standalone模式

Flink部署-standalone模式

Flink部署-standalone模式的更多相关文章

随机推荐

热门专题