top

里的id为cpu空闲度

如果wa为99.8就是负担太重。得停掉一些任务

cat /proc/cpuinfo

查看cpu信息

cat /proc/meminfo

查看内存信息

hadoop基础操作

start-all.sh

切换到hadoop用户启动hadoop

三个节点启动zkserver

cd  /usr/local/src/hadoop

zkServer.sh start

(master  jps)

8534 SecondaryNameNode

9659 Jps

8334 NameNode

8703 ResourceManager

8975 QuorumPeerMain

查看从属节点

bin/hdfs dfsadmin -report

查看hdfs空间使用情况

hdfs dfs -df /

HBase

进入目录查看版本

cd /usr/local/src/hbase/

hbase version

启动hbase

start-hbase.sh

进入hbase shell 界面

hbase  shell

hadoop

需要离开安全模式

hdfs dfsadmin -safemode leave

查看版本以及状态

hbase(main):001:0> version

1.2.1, r8d8a7107dc4ccbf36a92f64675dc60392f85c015, Wed Mar 30 11:19:21 CDT 2016

hbase(main):002:0> state

NameError: undefined local variable or method `state' for #<Object:0x78d71df1>

简单查询HBase状态

status 'simple'

查询更多关于 HBase 状态，执行命令

help  'status'

停止hbase

stop-hbase.sh

进入目录执行hive

cd /usr/local/src/hive

hive

hive

查看数据库

show  databases;

查看库里的所有表

use  default

show  tables;

创建表

create table stu(id int,name string);

信息插入表

insert into stu values (1001,'zhangsan');

显示表

show tables;

查看表结构

desc stu;

查看表信息

hive> select * from stu;

OK

1001    zhangsan

查看本地文件系统

hive> !ls /usr/local/src;

file:

flume

fox.java

hadoop

hbase

hive

jdk

sqoop

student.java

zookeeper

查看hdfs内容

hive> dfs -ls /;

Found 6 items

drwxr-xr-x   - hadoop supergroup          0 2022-05-20 16:12 /hbase

drwxr-xr-x   - hadoop supergroup          0 2022-04-25 19:20 /input

drwxr-xr-x   - hadoop supergroup          0 2022-04-25 19:20 /output

drwxr-xr-x   - hadoop supergroup          0 2022-04-25 19:26 /outputp

drwxrwxrwx   - hadoop supergroup          0 2022-05-06 15:14 /tmp

drwxr-xr-x   - hadoop supergroup          0 2022-04-29 17:05 /user

hive> 

查看历史命令

cd /home/hadoop/

cat   .hivehistory

监控大数据平台状态

查看zookeeper状态

[hadoop@master ~]$ zkServer.sh status

ZooKeeper JMX enabled by default

Using config: /usr/local/src/zookeeper/bin/../conf/zoo.cfg

Mode: follower

[hadoop@master ~]$

查看运行进程

jps

输入命令zkCli.sh 连接到zookeeper服务

zkCli.sh

开启监控

get  /hbase 1

[zk: localhost:2181(CONNECTED) 3] set /hbase value-update

cZxid = 0x700000002

ctime = Tue Apr 26 20:11:10 CST 2022

mZxid = 0xb0000005b

mtime = Fri May 20 16:46:52 CST 2022

pZxid = 0xb00000053

cversion = 22

dataVersion = 3

aclVersion = 0

ephemeralOwner = 0x0

dataLength = 12

numChildren = 14

[zk: localhost:2181(CONNECTED) 4]

数据版本变更 /hbase处于监控中

查看sqoop版本

cd  /usr/local/src/sqoop

./bin/sqoop-version

Warning: /usr/local/src/sqoop/../hcatalog does not exist! HCatalog jobs will fail.

Please set $HCAT_HOME to the root of your HCatalog installation.

Warning: /usr/local/src/sqoop/../accumulo does not exist! Accumulo imports will fail.

Please set $ACCUMULO_HOME to the root of your Accumulo installation.

22/05/20 16:48:44 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7

Sqoop 1.4.7

git commit id 2328971411f57f0cb683dfb79d19d4d19d185dd8

Compiled by maugli on Thu Dec 21 15:59:58 STD 2017

[hadoop@master sqoop]$

检查sqoop是否能够连接数据库

bin/sqoop   list-databases --connect jdbc:mysql://master:3306/ --username root --password Huawei123$

查看帮助

sqoop help

查看flume版本

cd /usr/local/src/flume

flume-ng  version

编写配置文件

vim /usr/local/src/flume/example.conf

[hadoop@master flume]$ vim /usr/local/src/flume/example.conf

# 在文件中写入以下内容

# a1 是 agent 名，r1,k1,c1 是 a1 的三个组件

a1.sources=r1

a1.sinks=k1

a1.channels=c1

# 设置 r1 源文件的类型、路径和文件头属性

a1.sources.r1.type=spooldir

a1.sources.r1.spoolDir=/usr/local/src/flume/

a1.sources.r1.fileHeader=true

# 设置 k1 目标存储器属性

a1.sinks.k1.type=hdfs # 目标存储器类型 hdfs

a1.sinks.k1.hdfs.path=hdfs://master:9000/flume # 目标存储位置

a1.sinks.k1.hdfs.rollsize=1048760 #临时文件达 1048760 bytes 时，滚动形

成目标文件

a1.sinks.k1.hdfs.rollCount=0 #0 表示不根据 events 数量来滚动形成目标文件

a1.sinks.k1.hdfs.rollInterval=900 # 间隔 900 秒将临时文件滚动形成目标文

件

a1.sinks.k1.hdfs.useLocalTimeStamp=true # 使用本地时间戳

# 设置 c1 暂存容器属性

a1.channels.c1.type=file # 使用文件作为暂存容器

a1.channels.c1.capacity=1000

a1.channels.c1.transactionCapacity=100

# 使用 c1 作为源和目标数据的传输通道

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

连接flume

/usr/local/src/flume/bin/flume-ng agent --

conf ./conf --conf-file ./example.conf --name a1 -

Dflume.root.logger=INFO,console

查看是否成功

hdfs dfs -lsr /flume

hadoop hive hbase flume sqoop基本操作的更多相关文章

Centos搭建mysql/Hadoop/Hive/Hbase/Sqoop/Pig
目录: 准备工作 Centos安装 mysql Centos安装Hadoop Centos安装hive JDBC远程连接Hive Hbase和hive整合 Centos安装Hbase 准备工作: 配置 ...
【原创】大叔问题定位分享（16）spark写数据到hive外部表报错ClassCastException: org.apache.hadoop.hive.hbase.HiveHBaseTableOutputFormat cannot be cast to org.apache.hadoop.hive.ql.io.HiveOutputFormat
spark 2.1.1 spark在写数据到hive外部表(底层数据在hbase中)时会报错 Caused by: java.lang.ClassCastException: org.apache.h ...
Hadoop + Hive + HBase + Kylin伪分布式安装
问题导读 1. Centos7如何安装配置? 2. linux网络配置如何进行? 3. linux环境下java 如何安装? 4. linux环境下SSH免密码登录如何配置? 5. linux环境下H ...
Hadoop Hive HBase Spark Storm概念解释
HadoopHadoop是什么? 答:一个分布式系统基础架构. Hadoop解决了什么问题? 答:解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储(HDFS) ...
从hbase到hive，以及sqoop转到mysql解析
https://blog.csdn.net/qq_33689414/article/details/80328665 hive关联hbase的配置文件 hive和hbase同步https://cwik ...
Hadoop Hive与Hbase整合+thrift
Hadoop Hive与Hbase整合+thrift 1. 简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句 ...
Hadoop Hive与Hbase关系整合
用hbase做数据库,但因为hbase没有类sql查询方式,所以操作和计算数据很不方便,于是整合hive,让hive支撑在hbase数据库层面的 hql查询.hive也即做数据仓库 1. 基于Ha ...
Centos中hive/hbase/hadoop/mysql实际操作及问题总结
目录 Hive中文乱码问题 hive和hbase的版本不一致 Ambari hive插入Hbase出错 Hive0.12和Hbase0.96不兼容,重新编译hive0.12.0 hiveserver不 ...
hadoop系列第二坑： hive hbase关联表问题
关键词: hive创建表卡住了创建hive和hbase关联表卡住了其实针对这一问题在info级别的日志下是看出哪里有问题的(为什么只能在debug下才能看见呢,不太理解开发者的想法). 以调试模式 ...
sqoop mysql--->hive 报错（ERROR tool.ImportTool: Import failed: java.io.IOException: java.lang.ClassNotFoundException: org.apache.hadoop.hive.conf.HiveConf）
ERROR tool.ImportTool: Import failed: java.io.IOException: java.lang.ClassNotFoundException: org.apa ...

随机推荐

架构与思维：了解Http 和 Https的区别（图文详解）
1 介绍随着 HTTPS 的不断普及和使用成本的下降,现阶段大部分的系统都已经开始用上 HTTPS 协议. HTTPS 与 HTTP 相比, 主打的就是安全概念,相关的知识如 SSL .非对称加密. ...
第二届算法、图像处理与机器视觉国际学术会议（AIPMV2024）
第二届算法.图像处理与机器视觉国际学术会议(AIPMV2024) 2024 2nd International Conference on Algorithm, Image Processing an ...
java redis 短信业务应用
java redis 短信业务应用短信业务场景:根据实际业务来通知客户,在短信的MQ中新增字段:是否需要发送短信的标识,短信微服务可以接收到MQ后根据该字段来判断是否发送. 如果发送端MQ的事件的操 ...
jqurey基础知识和常用事件方法
样式文件不需要<style>标签引用style文件的方法 <link href="main.css" rel="stylesheet" st ...
Java常用的十大开源工具类库总结
以下是个人总结的Java常用的十大开源工具类库,根据具体需求和项目,可以选择合适的工具类库来提高开发效率.1. Apache Commons:Apache Commons是一个开源的工具类库,提供了大 ...
高通Android UEFI中的LCD分析（2）：关键的函数
# 高通Android UEFI中的LCD分析(2):关键的函数背景在启动流程分析中,看到了几个经常出现的函数,这里实际分析一下有关的实现.以搞清楚高通做了什么,以及我们能做什么. 重要函数 MD ...
SqlServer 使用 case when 实现行转列，并创建视图表查询
其实是个很简单的操作了,但长时间不用有点忘记了,正好项目上遇到这样的需求便把过程记录了下来. 一需求描述将河道水情表结构如下,现在需要将水位Z字段由行展示转换为列展示.查询结果为展示时间和每个测 ...
静态 top tree 入门
理论我们需要一个数据结构维护树上的问题,仿照序列上的问题,我们需要一个方法快速的刻画出信息. 比如说线段树就通过分治的方式来通过将一个区间划分成 \(\log n\) 个区间并刻画出这 \(\log ...
转: fastapi https 配置
python3 快速生成 https 所需证书 from OpenSSL import crypto, SSL def generate_certificate( organization=&qu ...
SpringBoot学习篇
什么是SpringBoot?为什么要用SpringBoot 用来简化spring应用的初始搭建以及开发过程使用特定的方式来进行配置(properties或yml文件) 创建独立的spring引用程序 ...