Hadoop集群常用组件的命令

1. Hadoop
(1).HDFS：
启动HDFS：start-dfs.sh
关闭HDFS：stop-dfs.sh
格式化NameNode：hdfs namenode -format
查看文件系统状态：hdfs dfsadmin -report
创建目录：hdfs dfs -mkdir /path/to/directory
上传本地文件到HDFS：hdfs dfs -put /path/to/local/file /path/to/hdfs/directory
下载HDFS文件到本地：hdfs dfs -get /path/to/hdfs/file /path/to/local/directory
查看HDFS文件内容：hdfs dfs -cat /path/to/hdfs/file
删除HDFS文件：hdfs dfs -rm /path/to/hdfs/file

(2). YARN：
启动YARN：start-yarn.sh
关闭YARN：stop-yarn.sh
查看YARN节点状态：yarn node -list
查看YARN应用程序状态：yarn application -list
提交YARN应用程序：yarn jar /path/to/app.jar com.example.Application arg1 arg2
杀死YARN应用程序：yarn application -kill application_id

(3). MapReduce：
提交MapReduce作业：hadoop jar /path/to/job.jar com.example.Job input_path output_path
查看MapReduce作业状态：mapred job -list
杀死MapReduce作业：mapred job -kill job_id

2. Hive：
启动Hive服务：hive --service hiveserver2
关闭Hive服务：hive --service hiveserver2 --stop
连接到Hive服务：beeline -u jdbc:hive2://localhost:10000
查看Hive表列表：show tables;
创建Hive表：create table table_name (column1 type1, column2 type2, …)
插入数据到Hive表：insert into table table_name values (value1, value2, …)
查询Hive表数据：select * from table_name
删除Hive表：drop table table_name

3. Spark
启动Spark集群：start-all.sh
关闭Spark集群：stop-all.sh
启动Spark Shell：spark-shell
提交Spark应用程序：spark-submit --class com.example.Application /path/to/app.jar arg1 arg2
查看Spark应用程序状态：spark-submit --status application_id
杀死Spark应用程序：spark-submit --kill application_id

4. ZooKeeper：
启动ZooKeeper：zkServer.sh start
关闭ZooKeeper：zkServer.sh stop
连接到ZooKeeper客户端：zkCli.sh -server localhost:2181
创建ZooKeeper节点：create /path/to/node data
获取ZooKeeper节点数据：get /path/to/node
更新ZooKeeper节点数据：set /path/to/node new_data
删除ZooKeeper节点：delete /path/to/node

5.Flink
(1).启动和停止Flink集群
启动Flink集群：./bin/start-cluster.sh
停止Flink集群：./bin/stop-cluster.sh
(2).提交和取消作业
提交作业：./bin/flink run <path/to/job.jar>
取消作业：./bin/flink cancel
(3).查看作业和任务状态
查看作业列表：./bin/flink list
查看作业状态：./bin/flink list -r
查看任务状态：./bin/flink list -t
(4).查看作业日志
查看作业日志：./bin/flink log
(5).告诉Flink任务已完成: ./bin/flink advance
(6).查看Flink配置：./bin/flink run -m : <path/to/job.jar>
(7).查看Flink Web UI
Flink Web UI默认端口为8081，通过浏览器访问即可： http://IP:8081

6.Flume
(1).启动Flume Agent
启动Flume Agent需要使用flume-ng命令，以及指定配置文件的路径。例如：
$ flume-ng agent --conf-file /path/to/flume.conf --name agent-name
#这里的`/path/to/flume.conf`为Flume Agent的配置文件路径，`agent-name`为Flume Agent的名称。

(2).停止Flume Agent
停止Flume Agent需要使用kill命令，以及指定Flume Agent的进程ID。例如：
$ ps -ef |grep Flume
$ kill -9 pid
#这里的`pid`为Flume Agent的进程ID，可以使用ps命令查看: 。

(3).查看Flume Agent的状态
查看Flume Agent的状态需要使用flume-ng命令，以及指定Flume Agent的名称和命令。例如：
$ flume-ng agent --name agent-name --status
#这里的`agent-name`为Flume Agent的名称，`--status`为查看状态的命令。

(4).查看Flume Agent的日志
查看Flume Agent的日志需要使用tail命令，以及指定Flume Agent的日志文件路径。例如：
$ tail -f /path/to/flume.log
#这里的`/path/to/flume.log`为Flume Agent的日志文件路径。

(5).测试Flume Agent的配置是否正确
测试Flume Agent的配置是否正确需要使用flume-ng命令，以及指定配置文件的路径和命令。例如：
$ flume-ng agent --conf-file /path/to/flume.conf --name agent-name --conf-test
#这里的`/path/to/flume.conf`为Flume Agent的配置文件路径，`agent-name`为Flume Agent的名称，`--conf-test`为测试配置的命令。

(6).查看Flume Agent的帮助信息
查看Flume Agent的帮助信息需要使用flume-ng命令，以及指定命令。例如：
$ flume-ng help
#这里的`help`为查看帮助信息的命令。

Hadoop集群常用组件的命令的更多相关文章

Hadoop集群常用的shell命令
Hadoop集群常用的shell命令 Hadoop集群常用的shell命令查看Hadoop版本 hadoop -version 启动HDFS start-dfs.sh 启动YARN start-ya ...
hadoop记录-hadoop集群日常运维命令
hadoop集群日常运维命令 #1.namenode hadoop namenode -format #格式化,慎用 su hdfs hadoop-daemon.sh start namenode h ...
（转）hadoop 集群常用端口
转载于:https://www.cnblogs.com/liying123/p/7097806.html hadoop集群的各部分一般都会使用到多个端口,有些是daemon之间进行交互之用,有些是用于 ...
Hadoop入门集群常用知识与常用脚本总结
目录集群常用知识与常用脚本总结集群启动/停止方式 1 各个模块分开启动/停止(常用) 2 各个服务组件逐一启动/停止编写Hadoop集群常用脚本 1 Hadoop集群启停脚本myhadoop.s ...
Hadoop详解(02)Hadoop集群运行环境搭建
Hadoop详解(02)Hadoop集群运行环境搭建虚拟机环境准备虚拟机节点数:3台操作系统版本:CentOS-7.6-x86-1810 虚拟机内存4G,硬盘99G IP地址分配 192.16 ...
Hadoop 集群常见错误
这里将自己在初识hadoop过程中遇到的一些错误做一个简单总结: (一)启动hadoop集群时易出现的错误: 错误现象:java.net.NoRouteToHostException: No rout ...
高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南
原文:http://my.oschina.net/wstone/blog/365010#OSC_h3_13 (WJW)高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南 [X] ...
解决hadoop 集群启动常见错误办法
hadoop 集群常见错误解决办法 hadoop 集群常见错误解决办法: (一)启动Hadoop集群时易出现的错误: 1. 错误现象:Java.NET.NoRouteToHostException ...
hadoop 集群常见错误解决办法
hadoop 集群常见错误解决办法 hadoop 集群常见错误解决办法: (一)启动Hadoop集群时易出现的错误: 1. 错误现象:Java.NET.NoRouteToHostException ...
Hadoop集群-HDFS集群中大数据运维常用的命令总结
Hadoop集群-HDFS集群中大数据运维常用的命令总结作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客会简单涉及到滚动编辑,融合镜像文件,目录的空间配额等运维操作简介.话 ...

随机推荐

P5731
https://www.luogu.com.cn/problem/P5731 这道题被标为红题,真实难度应该介于红题和橙题之间,问题在于我高估了它的难度,以为至少有橙题的难度,一般不打表的我毫不犹豫选 ...
Blazor的技术优点
Blazor是一种使用.NET和C#构建客户端Web应用程序的新兴技术.它允许开发者在浏览器中直接运行.NET代码,而无需依赖JavaScript.Blazor的技术优点主要表现在以下几个方面: 单一 ...
Pgsql之查询一段时间内的所有日期
前几天干活儿的时候,项目中有这么个需求,需要用pgsql查询两个日期间的所有日期,包括年月日,下面贴代码: 1 select date(t) as day 2 from 3 generate_seri ...
CSS 动画：创建 3D 立方体
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
[转帖]OceanBase 存储引擎详解
https://zhuanlan.zhihu.com/p/436485359 作者简介:沈炼,蚂蚁集团技术风险部数据库高级专家毕业于东南大学,2014年以来从事 OceanBase 在蚂蚁的架构工作, ...
[转帖]金仓数据库KingbaseES 数据库参数优化
目录一.数据库应用类型二.主要参数 max_connections shared_buffers effective_cache_size maintenance_work_mem checkpo ...
Docker 运行 MongoDB的简单办法
Docker 运行 MongoDB的简单办法第一步拉取镜像 docker pull mongo 第二步创建自己的目录地址 10.24.22.240 创建目录 mkdir /mongodb 第三步 ...
查看 Oracle 数据库内没有Primary key 类型主键的表信息
查看 Oracle 数据库内没有Primary key 类型主键的表信息 SELECT * FROM user_tables A WHERE NOT EXISTS ( SELECT * FROM u ...
Redis6.x 在Windows上面编译安装的过程
背景说明在github上面仅能够找到 redis3.2.100的Windows安装文件比较新的版本比较难以找到, 同事经常出现这个版本的redis卡死的情况, 所以想尝试进行一下升级. 第一部分下 ...
Ant Design Vue表单验证失败
表单验证遇见的坑 01 如果你受控数据是这样写的话 const formState= reactive({ youForm:{ youNaNe:'', useSlectValue: '001', da ...

Hadoop集群常用组件的命令

Hadoop集群常用组件的命令的更多相关文章

随机推荐

热门专题