假期小结3Hadoop学习
学习Hadoop是一个很好的选择,因为它是大数据处理和分析领域最流行的框架之一。Hadoop提供了可靠、可扩展的分布式数据处理能力,适用于处理大规模数据和构建可靠的数据管道。
在学习Hadoop时,以下是一些关键概念和组件值得注意:
Hadoop分布式文件系统(HDFS):HDFS是Hadoop的存储层,它是一个分布式、容错的文件系统,设计用于在一组计算机集群上存储大规模数据集。
MapReduce:MapReduce是Hadoop的计算模型,用于对存储在HDFS上的数据进行并行处理。MapReduce将计算任务分成多个独立的阶段(Map和Reduce),并在集群上并行执行。
YARN:YARN是Hadoop的资源管理系统,负责集群中的资源分配和任务调度。YARN允许多种计算框架(如MapReduce、Spark等)在同一个Hadoop集群上运行。
Hive:Hive是一个基于Hadoop的数据仓库工具,它提供了类似于SQL的查询语言(Hive QL),允许用户通过类似SQL的语法进行数据查询和分析。
Pig:Pig是另一个基于Hadoop的数据分析平台,它使用一种称为Pig Latin的脚本语言来执行数据处理任务。
Spark:Spark是一个快速、通用的大数据处理框架。它提供了丰富的API,支持通过内存进行高速数据处理,并且可以与Hadoop生态系统无缝集成。
Hadoop生态系统中的其他组件:除了上述核心组件外,Hadoop生态系统还包括众多其他组件,如HBase(分布式列存储数据库)、Sqoop(用于Hadoop和关系数据库之间的数据传输)、Flume(用于数据采集和传输)等。
为了学习Hadoop,我安装和配置Hadoop集群,并进行一些基本的MapReduce任务。
以下是我学习到的一些hadoop的一些常用命令
1hadoop fs -mkdir [-p]创建文件夹[自动创建父路径] 创建文件夹
2hadoop fs -ls [-h] 客户端路径 查看文件夹
3hadoop fs -put 本地路径 客户端路径 上传文件
4hadoop fs -cat 客户端路径 查看文件内容
5hadoop fs -get 客户端路径 本地路径 下载文件
6hadoop fs -appendToFile 本地文件 本地文件... 客户端文件 追加文件内容末尾
7hadoop fs -mv 当前路径 目的路径 修改文件路径
假期小结3Hadoop学习的更多相关文章
- 假期小结 BIO, NIO, AIO
虽然忙碌,但仍小有收获,开心. 引子 BIO: Blocking IO,阻塞式IO NIO: Non-blocking IO,非阻塞式IO AIO: Async IO,异步IO 问题 什么是阻塞式IO ...
- 假期C语言学习笔记4
函数 经过三个星期的慕课的学习大致上学会了C的一些基本知识,在经过三个星期的C语言课本实践将书上的例题,课后练习实践挨个做了一遍,终于到了函数这一章.时间过的好快呀. 函数分为库函数和自定义函数:有返 ...
- OO课程的完结,软件工程学习的开始
目录 UML小结 阅读学习 大象:Thinking in UML UML精粹 UML和模式应用 本单元作业的架构设计 四个单元中架构设计及OO方法的演进 四个单元中测试与实践的演进 课程收获 三个具体 ...
- JMeter学习(十九)JMeter测试MongoDB
JMeter测试MongoDB性能有两种方式,一种是利用JMeter直接进行测试MongoDB,还有一种是写Java代码方式测试MongoDB性能. 第一种方法 1.编写Java代码,内容如下: pa ...
- Python学习笔记—itertools模块
这篇是看wklken的<Python进阶-Itertools模块小结> 学习itertools模块的学习笔记 在看itertools中各函数的源代码时,刚开始还比较轻松,但后面看起来就比较 ...
- [转]MySQL数据库备份和还原的常用命令小结
MySQL数据库备份和还原的常用命令小结,学习mysql的朋友可以参考下: 备份MySQL数据库的命令 mysqldump -hhostname -uusername -ppassword datab ...
- 奔五的人,准备学习iOS开发
这些年一直在java/web/android方面折腾,去年最终换成了apple的设备,本想就開始折腾iOS,却始终没能进入状态. 从今天開始,本人宣布:正式进入iOS/xcode 5的编程学习中,也希 ...
- Java学习(一)
各种原因就开始java开发快一个月了.一直也没有正式记录一下...现在开始..O(∩_∩)O~.... 先小结一下学习以来遇到的几个问题: 1.myeclipse的常用快捷键: F2当鼠标放在一个标记 ...
- C#学习笔记之值类型与引用类型
[TOC] C#学习笔记之值类型与引用类型 1.值类型与引用类型 1.1 深层区别 值类型与引用类型有不同的内存分布,这导致了不同的内存管理机制: 值类型由OS负责内存管理 引用类型由垃圾回收器(GC ...
- 20165221 Linux安装及命令入门学习
安装过程 按照图文教程,进行操作,遇到如下问题. 1.安装ubuntu时从官网下载不成功. 最后在同学的帮助下,通过中文版网址入口进入,完成下载. 2.BIOS未恢复出厂设置,导致不能选择64-bit ...
随机推荐
- 使用Newtonsoft.Json进行Json与XML相互转换
XML的解析得考虑子节点父节点,让人头昏眼花,而JSON的解析好像没啥难度.今天突然发现Newtonsoft.Json中有关于Json和XML互转的方法,所以顺带记录总结一下. 一.关于Newtons ...
- latex图片格式问题解决(viso转PDF转eps)
latex图片格式问题解决(viso->PDF->eps) 1.viso绘图 如何让界面自动适应图的大小? 设计->大小->适应绘图 如何将VISIO图转换为PDF? 文件-& ...
- 自用电脑+外网开放+SSL认证(纯免费)
背景: 本文的目的主要是为了方便大家测试,不过有条件的情况下没必要学习了.主要是给那些没有服务器,公司也不给ssl认证的开发测试人员的一种方案:就像题目所说的那样. 纯免费,纯免费的话是有学习成本的, ...
- Nodejs概述 安装Nodejs os模块 path模块 url模块 querystring模块
一.Nodejs概述 介绍 相关网址: https://nodejs.org/zh-cn/ http://nodejs.cn/ Node.js 是一个开源与跨平台的JavaScript 运行时环境.它 ...
- 剑指Offer-47.求1+2+3+...+n(C++/Java)
题目: 求1+2+3+...+n,要求不能使用乘除法.for.while.if.else.switch.case等关键字及条件判断语句(A?B:C). 分析: 利用短路与来判断n是否大于0,从而实现递 ...
- GO语言 GOLANG 上传微信电子小票图片
GO语言 GOLANG 上传微信电子小票图片.GO HTTP POST 图片文件.GO 上传图片文件.multipart/form-data.image/jpeg.image/png. GO 环境: ...
- XML文档定义的几种形式和本质区别
XML文档定义的形式 两种定义形式:DTD.Schema DTD:数据类型定义(Data Type Definition),用以描述XML文档的文档结构,是早期的XML文档定义形式. Schema:其 ...
- MySQL查询关于区分字母大小写问题
前段时间在工作中测试提出了一个BUG,让我把根据ID查询区分大小写的功能去掉,大小写都随便查,然后我在SQL的位置加上了UPPER(id) = UPPER(#{id})的写法,而同事知道这个问题后的反 ...
- VSCode中设置用IPython运行Python代码
VSCode中设置用IPython运行Python代码 在IPython中运行所选的代码: 在设置中, 找到python.terminal.launchArgs这一项, 设置为如下内容. " ...
- Redis查询大key
原文 安装 wget "https://pypi.python.org/packages/68/44/5efe9e98ad83ef5b742ce62a15bea609ed5a0d1caf35 ...