bayaim_hadoop2_hdfs_20181107
------------------bayaim_bayaim_hadoop2_hdfs_20181107---------------------------------
HDFS 原理:上传数据要分块(128M)分块存储
分布式文件系统
---------先启动HDFS----------------
1. sbin/start-dfs.sh
一直输入:yes
电脑密码: root/dba_2018
-----------再启动YARN-----------
2. sbin/start-yarn.sh
3 验证是否启动成功
# jps ------------------------------
使用jps命令验证
27408 NameNode ----hdfs 的老大
28218 Jps ----java 相关的命令
27643 SecondaryNameNode ----hdfs 的助理,帮助数据同步
28066 NodeManager ----YARN 的小弟
27803 ResourceManager ----YARN 的老大,资源的分配 调度
27512 DataNode ----hdfs 的小弟
[root@testoracle sbin]# ./stop-all.sh ---------------------------------
This script is Deprecated. Instead use stop-dfs.sh and stop-yarn.sh
Stopping namenodes on [testoracle]
testoracle: stopping namenode
localhost: stopping datanode
Stopping secondary namenodes [0.0.0.0]
0.0.0.0: stopping secondarynamenode
stopping yarn daemons
stopping resourcemanager
localhost: stopping nodemanager
no proxyserver to stop
[root@testoracle sbin]# ./start-dfs.sh ---------------------------------
[root@testoracle sbin]# hadoop fs -ls hdfs://testoracle:9000/
[root@testoracle sbin]# hadoop fs -copyFromLocal /home/oracle/import.log /import.log (管道,进行分页)
[root@testoracle ~]# hadoop fs -ls -R /
[root@testoracle ~]# hdfs dfs -ls -R /
[root@testoracle hadoop-2.2.0]# hadoop fs -chgrp root /import.log
[root@testoracle hadoop-2.2.0]# hadoop fs -ls /
http://192.168.210.82:50070 (HDFS管理界面)
http://192.168.210.82:8088 (MR管理界面YARN)
1.元数据 : 文件存了几个副本 、 有几块、 在哪台机器上(账本,数据的描述信息,namenode metadata)
2.数据:datanodes 怎么知道文件损坏:校验核 、 MD5值 算法(每个文件是唯一的)大数据采用C32 校验机制
bayaim_hadoop2_hdfs_20181107的更多相关文章
随机推荐
- Zimbra
第一步:利用XXE读取配置文件 这里利用了CVE-2019-9670漏洞来读取配置文件,你需要在自己的VPS服务器上放置一个dtd文件,并使该文件能够通过HTTP访问.为了演示,我在GitHub上创建 ...
- HTTPS请求处理
HTTPS请求的时候: [1]证书是受信任的,什么都不用做 [2]证书是不受信任的,是自签名的 (1)修改配置文件,禁用ATS特性 (2)信任并安装数字证书 NSURLSession的示例代码如下: ...
- echarts玩转图表之矩形树图
前言 这是第一次用makedown编辑器写文章,感觉像一件利器,排版美观而且效率飙升.进入正题 Echart官网文档地址 针对于矩形树图api配置项链接 1. 完全从数据定义图形 $.get( &qu ...
- 【Java基础】Java中的反射机制
一.反射的理解 (1)正射 在理解反射这个概念之前,我们先来理解Java中的“正射”. 我们在编写代码时,当需要使用到某一个类的时候,必定先会去了解这是一个什么类,是用来做什么的,有怎么样的功能. 之 ...
- MySQL 优化 (四)
参数优化 innodb_log_buffer_size 此参数确定些日志文件所用的内存大小,以M为单位.缓冲区更大能提高性能,对于较大的事务,可以增大缓存大小. innodb_log_buffer_s ...
- s3c2440裸机-UART编程(一、UART硬件介绍及传输原理)
1.uart硬件介绍 UART的全称是Universal Asynchronous Receiver and Transmitter(异步收发器). uart主要用于: 1.打印调试 2.数据传输 串 ...
- 浅谈python之利用pandas和openpyxl读取excel数据
在自学到接口自动化测试时, 发现要从excel中读取测试用例的数据, 假如我的数据是这样的: 最好是每行数据对应着一条测试用例, 为方便取值, 我选择使用pandas库, 先安装 pip instal ...
- Statements、PreparedStatement及CallableStatement(三)
当获得了与数据库的连接后,就可以与数据库进行交互了.JDBC Statement,CallableStatement和PreparedStatement接口定义了可用于发送SQL或PL/SQL命令,并 ...
- rowKey原则
rowKey设计原则 1.长度原则 最大值为64KB, 长度在10 ~ 100byte ; 最好是 8 的倍数,太长会影响性能: 2.唯一原则 具有唯一性: 3.散列原则 1).盐值散列:不能使用时间 ...
- for(var i in items) 和 for(var i;i<items.length;i++) 区别
前者循环的是属性,后者循环的才是数组. 若项目中对数组属性进行了扩展,那切记不能使用前者,否则在循环数组时扩展的函数体也会被当做数据返回. var data = { p1:1, p2:"b& ...