Flink on Yarn三部曲之二：部署和设置

欢迎访问我的GitHub

https://github.com/zq2599/blog_demos

内容：所有原创文章分类汇总及配套源码，涉及Java、Docker、Kubernetes、DevOPS等；

本文是《Flink on Yarn三部曲》系列的第二篇，上一篇《Flink on Yarn三部曲之一：准备工作》已将所需的机器和文件准备完毕，可以部署CDH和Flink了；

全文链接

执行ansible脚本部署CDH和Flink(ansible电脑)

进入ansible电脑的~/playbooks目录，经过上一篇的准备工作，该目录下应该是下图这些内容：
检查ansible远程操作CDH服务器是否正常，执行命令ansible deskmini -a "free -m"，正常情况下显示CDH服务器的内存信息，如下图：
执行命令开始部署：ansible-playbook cm6-cdh5-flink1.7-single-install.yml
整个部署过程涉及在线安装、传文件等耗时的操作，因此请耐心等待（半小时左右），如果部署期间出错退出（例如网络问题），只需重复执行上述命令即可，ansible保证了操作的幂等性；
部署成功如下图所示：

重启CDH服务器

由于修改了selinux和swap的设置，需要重启操作系统才能生效，因此请重启CDH服务器；

执行ansible脚本启动CDH服务(ansible电脑)

等待CDH服务器重启成功；
登录ansible电脑，进入~/playbooks目录；
执行初始化数据库和启动CDH的脚本：ansible-playbook cdh-single-start.yml
启动完成输出如下信息：
ssh登录CDH服务器，执行此命令观察CDH服务的启动情况：tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log，看到下图红框中的内容时，表示启动完成，可以用浏览器登录了：

设置(浏览器操作)

现在CDH服务已经启动了，可以通过浏览器来操作：

浏览器访问：http://192.168.50.134:7180 ，如下图，账号密码都是admin：
一路next，在选择版本页面选择60天体验版：
选择主机页面可见CDH服务器（deskmini）：
在选择CDH版本的页面，请选择下图红框中的5.16.2-1：
进入安装Parcel的页面，由于提前上传了离线parcle包，因此下载进度瞬间变成百分之百，此时请等待分配、解压、激活的完成：
接下来有一些推荐操作，这里选择如下图红框，即可跳过：
接下来是选择服务的页面，我选择了自定义服务，然后选择了HDFS、YARN、Zookeeper这三项，可以满足运行Flink的需要：
在选择主机的页面，都选择CDH服务器：
接下来是数据库设置的页面，您填写的内容必须与下图保持一致，即主机名为localhost，Activity Monitor的数据库、用户、密码都是amon，Reports Manager的数据库、用户、密码都是rman，这些内容在ansible脚本中已经固定了，此处的填写必须保持一致：
在设置参数的页面，请按照您的硬盘实际情况设置，我这里/home目录下空间充足，因此存储位置都改为/home目录下：
等待服务启动：
各服务启动完成：

YARN设置

默认的YARN参数是非常保守的，需要做一些设置才能顺利执行Flink任务：

点下图红框位置，进入YARN管理页：
如下图所示，检查参数yarn.nodemanager.resource.cpu-vcores的值，该值必须大于1，否则提交Flink任务后YARN不分配资源执行任务，（如果您的CDH服务器是虚拟机，当CPU只有单核时，则此参数就会被设置为1，解决办法是先提升虚拟机CPU核数，再来修改此参数）：
yarn.scheduler.minimum-allocation-mb：单个容器可申请的最小内存，我这里设置为1G
yarn.scheduler.maximum-allocation-mb：单个容器可申请的最大内存，我这里设置为8G
yarn.nodemanager.resource.memory-mb：节点最大可用内存，我这里设置为8G
上述三个参数的值，是基于我的CDH服务器有32G内存的背景，请您按照自己硬件资源自行调整；
设置完毕后重启YARN服务，操作如下图所示：

至此，部署和设置都已完成，Flink on Yarn的环境已经可用了，在下一篇文章中，我们就在此环境提交Flink任务，体验Flink on Yarn；

欢迎关注公众号：程序员欣宸

微信搜索「程序员欣宸」，我是欣宸，期待与您一同畅游Java世界...

https://github.com/zq2599/blog_demos

Flink on Yarn三部曲之二：部署和设置的更多相关文章

Flink on Yarn三部曲之一：准备工作
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
Flink on Yarn三部曲之三：提交Flink任务
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
Flink的DataSource三部曲之二:内置connector
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
Flink的DataSource三部曲之三:自定义
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
Flink的DataSource三部曲之一：直接API
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
CDH5部署三部曲之二：部署和设置
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
CDH+Kylin三部曲之二：部署和设置
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
Flink on Yarn的两种模式及HA
转自:https://blog.csdn.net/a_drjiaoda/article/details/88203323 Flink on Yarn模式部署始末:Flink的Standalone和on ...
Flink源码阅读（一）——Flink on Yarn的Per-job模式源码简析
一.前言个人感觉学习Flink其实最不应该错过的博文是Flink社区的博文系列,里面的文章是不会让人失望的.强烈安利:https://ververica.cn/developers-resource ...

随机推荐

[LeetCode]494. 目标和、416. 分割等和子集（0-1背包，DP）
题目一 494. 目标和给定一个非负整数数组,a1, a2, ..., an, 和一个目标数,S.现在你有两个符号 + 和 -.对于数组中的任意一个整数,你都可以从 + 或 -中选择一个符号添加在前 ...
MVC设计模式-笔记1
MVC不仅仅是一个设计模式,它应该说是一种软件开发架构模式,它包含了很多的设计模式,最为密切是以下三种模式: 1.Observer观察者模式 2.Composite组合模式 3.Strategy策略模 ...
linux学习（三）Linux 系统目录结构
一.查看目录登录系统后,在当前命令窗口下输入命令: ls / 树状目录结构: 二.目录解析 /bin: 存放二进制可执行文件(ls,cat,mkdir等). /boot: 存放启动Linux时使用的 ...
Spring学习（三）Spring AOP 简介
一.简介定义 aop就是面向切面编程,在数据库事务中切面编程被广泛使用. 在面向切面编程的思想里面,把功能分为核心业务功能,和周边功能. 核心业务:比如登陆,增加数据,删除数据都叫核心业务周边功能 ...
MySQL分区 (分区介绍与实际使用)
分区介绍: 一.什么是分区? 所谓分区,就是将一个表分成多个区块进行操作和保存,从而降低每次操作的数据,提高性能.而对于应用来说则是透明的,从逻辑上看只有一张表,但在物理上这个表可能是由多个物理分区组 ...
Processing 高效控制管理图形方法（二）
之前在CSDN上发表过: https://blog.csdn.net/fddxsyf123/article/details/70992924
Centos-归档文件或目录-tar
tar 对文件或者目录进行打包归档成一个文件,不是压缩相关选项 -c 新建文件 -r 将目标文件追加都档案文件末尾 -t 列出归档文件中已经归档文件列表 -x 从归档文件中还原文件 -u 新文件更新 ...
Centos-shell-简介
shell 壳 1. 用户在操作系统上完成的所有任务都是通过shell与linux内核的交互实现的, 是用户和操作系统内核之间的通信桥梁用户操作任务 <__> shell <__& ...
嵌入式arm-linux mips-linux 交叉编译GDB,结合vscode图形化调试使用，coredump定位段错误
第一部分:使用GDB GDB源码下载路径:http://ftp.gnu.org/gnu/gdb/ 遇到的主要难点: 选择合适的GDB源码版本我的mips-linux交叉编译器不支持C++11特性,所 ...
源码安装IVRE
简介:IVRE(又名DRUNK)是一款开源的网络侦查框架工具,IVRE使用Nmap.Zmap进行主动网络探测.使用Bro.P0f等进行网络流量被动分析,探测结果存入数据库中,方便数据的查询.分类汇总统 ...