大数据HDFS集群相关概念
一、Zookeeper服务
端口 | 描述 | 配置路径 |
2181 | 主要使用端口,对cline端提供服务。连接方式jdbc:hive2://ip:2181 | conf/zoo.cfg中clientPort |
2183 | 选举leader使用 | conf/zoo.cfg中server.x=2182:2183 |
2182 | 集群内机器通讯使用(Leader监听此端口) | conf/zoo.cfg中server.x=2182:2183 |
二、Hive服务
端口 | 描述 | 配置路径 |
7004 | Metastore,连接方式thrift://ip:7004 | hive-site.xml 的hive.metastore.port |
7001 | HiveServer2 | hive-site.xml 的hive.server2.thrift.port |
三、Yarn服务
服务 | 端口 | 描述 | 配置路径 |
ResourceManager | 5000 | RM的applications manager端口 | yarn.resourcemanager.address |
5001 | scheduler组件的IPC端口 | yarn.resourcemanager.scheduler.address | |
5002 | IPC | yarn.resourcemanager.resource-tracker.address | |
5003 | IPC | yarn.resourcemanager.admin.address | |
5004 | http服务端口 | yarn.resourcemanager.webapp.address | |
NodeManager | 8040 | localizer IPC | yarn.nodemanager.localizer.address |
8042 | http服务端口 | yarn.nodemanager.webapp.address | |
8041 | NM中container manager的端口 | yarn.nodemanager.address | |
JobHistory Server | 5022 | IPC | mapreduce.jobhistory.address |
5023 | MR jobhistory admin地址,用以接收history admin命令 | mapreduce.jobhistory.admin.address | |
5024 | http服务端口 | mapreduce.jobhistory.webapp.address |
四、HDFS服务
服务 | 端口 | 描述 | 配置路径 |
DataNode | 50010 | datanode服务端口,用于数据传输 | dfs.datanode.address |
50075 | http服务的端口 | dfs.datanode.http.address | |
50475 | https服务的端口 | dfs.datanode.https.address | |
50020 | ipc服务的端口 | dfs.datanode.ipc.address | |
NameNode | 4008 | http服务的端口 | dfs.namenode.http-address |
4009 | https服务的端口 | dfs.namenode.https-address | |
8020 | 接收Client连接的RPC端口,用于获取文件系统metadata信息。 | fs.defaultFS |
大数据HDFS集群相关概念的更多相关文章
- 大数据-HDFS 集群搭建的配置文件
1.HDFS简单版集群搭建相关配置文件 1.core-site.xml文件 <property> <name>fs.defaultFS</name> <val ...
- 大数据Hadoop-Spark集群部署知识总结(一)
大数据Hadoop-Spark集群部署知识总结 一.启动/关闭 hadoop myhadoop.sh start/stop 分步启动: 第一步:在hadoop102主机上 sbin/start-dfs ...
- [转]大数据hadoop集群硬件选择
问题导读 1.哪些情况会遇到io受限制? 2.哪些情况会遇到cpu受限制? 3.如何选择机器配置类型? 4.为数据节点/任务追踪器提供的推荐哪些规格? 随着Apache Hadoop的起步,云客户 ...
- 大数据——Hadoop集群坏境CentOS安装
前言 前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMwa ...
- 部署开启了Kerberos身份验证的大数据平台集群外客户端
转载请注明出处 :http://www.cnblogs.com/xiaodf/ 本文档主要用于说明,如何在集群外节点上,部署大数据平台的客户端,此大数据平台已经开启了Kerberos身份验证.通过客户 ...
- 大数据 -- Hadoop集群环境搭建
首先我们来认识一下HDFS, HDFS(Hadoop Distributed File System )Hadoop分布式文件系统.它其实是将一个大文件分成若干块保存在不同服务器的多个节点中.通过联网 ...
- 一台虚拟机,基于docker搭建大数据HDP集群
前言 好多人问我,这种基于大数据平台的xxxx的毕业设计要怎么做.这个可以参考之前写得关于我大数据毕业设计的文章.这篇文章是将对之前的毕设进行优化. 个人觉得可以分为两个部分.第一个部分就是基础的平台 ...
- 入门大数据---Redis集群分布式学习
Redis是什么? 官方介绍: Redis 是一个开源(BSD许可)的,内存中的数据结构存储系统,它可以用作数据库.缓存和消息中间件. 它支持多种类型的数据结构,如 字符串(strings), 散列( ...
- 大数据-zookeeper集群安装
一.安装前发现的问题: 1.安装前期发现jps权限不够 [root@master1 ~]# jps -bash: /opt/workspace/jdk1./bin/jps: Permission de ...
- 大数据 --> Kafka集群搭建
Kafka集群搭建 下面是以三台机器搭建为例,(扩展到4台以上一样,修改下配置文件即可) 1.下载kafka http://apache.fayea.com/kafka/0.9.0.1/ ,拷贝到三台 ...
随机推荐
- Python消息队列之Huey
缘起: 之前在Python中使用最多的就是Celery, 同样的在这次项目中使用了Celery+eventlet的方式,但是由于具体执行的逻辑是使用的异步编写的, 当时就出现了一个问题,当使用http ...
- 水位波纹动画兼容ie8
效果观看请到下方: 链接:https://pan.baidu.com/s/1AWHz0BHTmj_7Vx6qhSmuaA 提取码:ih9p 复制这段内容后打开百度网盘手机App,操作更方便哦 下面介绍 ...
- PowerShell 重命名文件夹及删除空文件夹
数据来源 $urldata 中的倒数第2列(子文件夹名称列)包含 /.\ 等特殊字符 某个文件夹重命名脚本 foreach ($i in 0..100) { # 提取路径部分 $basePath = ...
- 2-SQL注入渗透与攻防
1.SQL注入基础 1.1 什么是sql注入 一.SQL注入概述 二.数据库概述 1.关系型数据库 关系型数据库,存储格式可以直观的反映实体间的关系,和常见的表格比较相似 关系型数据库中表与表之间有很 ...
- 在 ASP.NET Core 中进行打包 (Bundling) 和紧缩 (Minification)
在 ASP.NET Core 中进行打包 (Bundling) 和紧缩 (Minification) Bundler & Minifier for Visual Studio 2019 Bun ...
- 助推乡村振兴,四川农担X中电金信大数据智能风控平台彰显“榜样的力量”
在2024年3月召开的两会上,政府工作报告首次提到了要大力发展科技金融.绿色金融.普惠金融.养老金融.数字金融,为深入推进金融高质量发展,走中国特色金融发展之路指明了方向.其中,四川农担作为一家专注 ...
- 【Python基础练习】实验3:列表、字典、集合
实验3:列表.字典.集合 姓名:萌狼蓝天 时间:2023年11月6日 Python:3.12 博客:https://wwww.mllt.cc 实验目的 (1)了解列表.元组.字典和集合的概念 (2)学 ...
- 【Linux】【虚拟机】 IP地址的动态与静态设置
目录 配置文件的修改 配置文件的修改 vim /etc/sysconfig/network-scripts/ifcfg-ens33 IP配置方式(不指定:none,静态:static,动态:dhcp) ...
- 巧用mask属性创建一个纯CSS图标库
说明 mask 是CSS中的一个属性,它允许开发者在元素上设置图像作为遮罩层.这个属性的强大之处,在于它可以接受多种类型的值,包括关键字值.图像值.渐变色,甚至可以设置多个属性值. SVG(Scala ...
- kubernetes上报Pod已用内存不准问题分析
1.问题描述: 经常有业务反馈在使用容器云平台过程中监控展示的业务使用内存不准,分析了下kubernetes采集Pod内存使用的实现原理以及相应的解决思路 2.问题分析: 2.1 问题排查: 监控数据 ...