------------------bayaim_bayaim_hadoop2_hdfs_20181107---------------------------------

HDFS 原理:上传数据要分块(128M)分块存储
分布式文件系统
---------先启动HDFS----------------
1. sbin/start-dfs.sh
一直输入:yes
电脑密码: root/dba_2018
-----------再启动YARN-----------
2. sbin/start-yarn.sh
3 验证是否启动成功
# jps ------------------------------
使用jps命令验证
27408 NameNode ----hdfs 的老大
28218 Jps ----java 相关的命令
27643 SecondaryNameNode ----hdfs 的助理,帮助数据同步
28066 NodeManager ----YARN 的小弟
27803 ResourceManager ----YARN 的老大,资源的分配 调度
27512 DataNode ----hdfs 的小弟
[root@testoracle sbin]# ./stop-all.sh ---------------------------------

This script is Deprecated. Instead use stop-dfs.sh and stop-yarn.sh
Stopping namenodes on [testoracle]
testoracle: stopping namenode
localhost: stopping datanode
Stopping secondary namenodes [0.0.0.0]
0.0.0.0: stopping secondarynamenode
stopping yarn daemons
stopping resourcemanager
localhost: stopping nodemanager
no proxyserver to stop

[root@testoracle sbin]# ./start-dfs.sh ---------------------------------
[root@testoracle sbin]# hadoop fs -ls hdfs://testoracle:9000/
[root@testoracle sbin]# hadoop fs -copyFromLocal /home/oracle/import.log /import.log (管道,进行分页)
[root@testoracle ~]# hadoop fs -ls -R /
[root@testoracle ~]# hdfs dfs -ls -R /
[root@testoracle hadoop-2.2.0]# hadoop fs -chgrp root /import.log
[root@testoracle hadoop-2.2.0]# hadoop fs -ls /

http://192.168.210.82:50070 (HDFS管理界面)
http://192.168.210.82:8088 (MR管理界面YARN)

1.元数据 : 文件存了几个副本 、 有几块、 在哪台机器上(账本,数据的描述信息,namenode metadata)
2.数据:datanodes 怎么知道文件损坏:校验核 、 MD5值 算法(每个文件是唯一的)大数据采用C32 校验机制

bayaim_hadoop2_hdfs_20181107的更多相关文章

随机推荐

  1. .netcore控制台->定时任务Quartz

    之前做数据同步时,用过timer.window服务,现在不用那么费事了,可以使用Quartz,并且配置灵活,使用cron表达式配置XML就可以.我用的是3.0.7版本支持.netcore. 首先创建一 ...

  2. vue小案例--简易评论区

    一.小案例(评论区) 1.流程 (1)分析静态页面.(vue项目创建参考https://www.cnblogs.com/l-y-h/p/11241503.html)(2)拆分静态页面,变成一个个组件. ...

  3. ES6-字符串模板

    es6字符串模板 // es5 let ananiah = "大诶呀"; let blog = "我要忘了你的样子"+ ananiah; console.log ...

  4. HttpWebRquest.GetRequestStreamAsync()发生延迟

    前景提要:此问题不定适用Browser通信方式,主要提供给通信发生异常时解决思路. Q: request请求创建过程发生延迟 [Scene]: ​ .Net的HttpWebRquest.GetRequ ...

  5. ABP入门教程3 - 解决方案

    点这里进入ABP入门教程目录 创建项目 点这里进入ABP启动模板 如图操作,我们先生成一个基于.NET Core的MPA(多页面应用).点击"Create my project!" ...

  6. 19-Docker 镜像小结

    本节我们对 Docker 镜像做个小结. 这一部分我们首先讨论了镜像的分层结构,然后学习了如何构建镜像,最后实践使用 Docker Hub 和本地 registry. 下面是镜像的常用操作子命令: i ...

  7. MySQL数据库:基本操作及增删改查语句

    基本语法&&操作语句 create(创建) alter(更新) drop(删除) 一次性删除一个表中所有的数据 包括日志 truncate table 表名; 选中或者使用该数据库 说 ...

  8. s3c2440裸机-UART编程(一、UART硬件介绍及传输原理)

    1.uart硬件介绍 UART的全称是Universal Asynchronous Receiver and Transmitter(异步收发器). uart主要用于: 1.打印调试 2.数据传输 串 ...

  9. python中copy()和deepcopy()详解

    **首先直接上结论: —–我们寻常意义的复制就是深复制,即将被复制对象完全再复制一遍作为独立的新个体单独存在.所以改变原有被复制对象不会对已经复制出来的新对象产生影响.—–而浅复制并不会产生一个独立的 ...

  10. CF1253E Antenna Coverage(DP)

    本题难点在正确性证明. 令 \(f_i\) 表示 \([1,i]\) 被全部覆盖的最小花费.答案为 \(f_m\). 首先发现,添加一个区间 \([0,0]\) 不会影响答案.所以 \(f_i\) 的 ...