Spark修炼之道(基础篇)——Linux大数据开发基础:第二节:Linux文件系统、文件夹(一)
本节主要内容
- 怎样获取帮助文档
- Linux文件系统简单介绍
- 文件夹操作
- 訪问权限
1. 怎样获取帮助文档
在实际工作过程其中,常常会忘记命令的使用方式。比如ls命令后面能够跟哪些參数,此时能够使用man命令来查看其使用方式。比如
//man命令获取命令帮助手冊
xtwy@ubuntu:~$ man ls
能够使用键盘上的 来显示下一行或上一行命令,也能够使用
进行上一页或下一页(屏)命令的查看,另外
空格鍵也能够用来显示下一屏的命令。想退出命令查看,直接按q鍵退出就可以。也能够h鍵显示less命令列表(man命令通过less命令输出结果)
2. Linux文件系统简单介绍
(一) 文件和文件夹
本节从使用者的角度来介绍Linux文件系统,Linux依据文件形式将文件分为文件夹和普通文件,例如以下图:
文件夹或文件的名称长度不超过255个字符,文件或文件夹名可由下列字符构成:
- Uppercase letters (A–Z)
- Lowercase letters (a–z)
- Numbers (0–9)
- Underscore ( _ )
- Period(.)
- Comma(,)
文件或文件夹名区分大写和小写,属于不同的文件或文件夹
(二) 文件扩展名与不可见文件名称
与Window操作系统有非常大不同的是。Linux文件对文件扩展名没有强制要求。比如假设编写了一个c语言源文件,你能够将其命名为complier.c,也能够是其他如complier、complier.ccc等文件名称。但不推荐这么做,由于假设能将文件扩展名与特定的文件进行关联的话。有利于理解文件内容,眼下约定成俗的linux文件扩展名例如以下表:
| 带扩展名的文件名称 | 扩展名的含义 |
|---|---|
| max.c | C语言源文件 |
| max.o | 编码后的目标代码文件 |
| max | max.c相应的可运行文件 |
| memo.txt | 文本文件 |
| memo.pdf | pdf文件。必须在GUI界面上使用xpdf或kpdf才干查看 |
| memo.ps | PostScript文件。必须在GUI界面上使用ghostscript或kpdf才干查看 |
| memo.z | 经压缩程序压缩后的文件,可使用uncompress或gunzip解压 |
| memo.gz | 经gzip压缩程序压缩后的文件,可使用gunzip解压 |
| memo.tar.gz或memo.tgz | 经gzip压缩后的tar归档文件,可使用gunzip解压 |
| memo.bz2 | 经bzip2压缩后的文件,可使用bunzip2解压 |
| memo.html | html文件。使用GUI环境的firefox查看 |
| memo.jpg等 | 图像文件,使用GUI环境的照片查看器打开 |
在前一讲中我们看到。linux中还存在大量的隐藏文件。採用ls -a 命令能够显示。想定义隐藏文件。仅仅要文件名称或文件夹以.開始就可以
(三) 绝对路径与相对路径
在Linux中绝对路径与相对路径是一个非常重要的概念。下图给出了什么是绝对路径
全部以根文件夹”/”作为開始的都是绝对路径,其他的均为相对路径
//绝对路径訪问
xtwy@ubuntu:~/Public$ cd /home/
xtwy@ubuntu:/home$ ls
xtwy
//相对路径訪问
xtwy@ubuntu:/home$ cd xtwy/
3. 文件夹操作
(一) 创建文件夹 mkdir
为演示方便,使用下列文件夹结构进行演示:
1 绝对路径创建方式
//使用绝对路径创建
root@ubuntu:/home# mkdir /home/max
root@ubuntu:/home# ls
max xtwy
root@ubuntu:/home#
2 相对路径创建方式
//使用相对路径进行创建
root@ubuntu:/home# mkdir max/names
root@ubuntu:/home# mkdir max/temp
root@ubuntu:/home# mkdir max/literature
root@ubuntu:/home# cd max
root@ubuntu:/home/max# mkdir demo
root@ubuntu:/home/max# ls
demo literature names temp
有时不想层层文件夹创建。此时能够在mkdir 后面加上參数 -p(parents)。将父子文件夹一起创建
root@ubuntu:/home/max# mkdir -p literature/promo
root@ubuntu:/home/max# ls
demo literature names temp
root@ubuntu:/home/max# cd literature/
root@ubuntu:/home/max/literature# ls
promo
(二) 更改文件夹 cd
工作文件夹与主文件夹的区别
用户每次登录后的默认文件夹就是主文件夹,与系统会话期间保持不变,主文件夹用~表示
xtwy@ubuntu:/root$ cd ~
xtwy@ubuntu:~$ pwd
/home/xtwy
工作文件夹又称当前文件夹,cd命令运行完毕后的文件夹就是工作文件夹,它是能够任意改变的。
//.表示当前文件夹即工作文件夹
//..表示当前文件夹的上一级文件夹
xtwy@ubuntu:~$ cd .
xtwy@ubuntu:~$ cd ..
xtwy@ubuntu:/home$
(三) 删除文件夹 rmdir
rmdir是remove directory的简称,用于删除文件夹,它先删除文件夹下的全部文件,然后再删除该文件夹,但当文件夹下还有子文件夹时。该命令不能运行。须要使用rm命令,比如
//删除temp文件夹,先删除文件夹下的文件
//再删除temp文件夹自身
root@ubuntu:/home/max# rmdir temp/
root@ubuntu:/home/max# rmdir literature/
rmdir: failed to remove `literature/': Directory not empty
root@ubuntu:/home/max# rm -r literature/
root@ubuntu:/home/max# ls
demo names
其中rm -r中的r指的是递归的删除文件夹及文件夹中的文件,因此它具有非常强的破坏力,要慎重使用。
(四) 移动文件夹 mv
//将文件夹demo移到/home/xtwy/文件夹下
root@ubuntu:/home/max# mv demo/ /home/xtwy/
root@ubuntu:/home/max# cd /home/xtwy/
root@ubuntu:/home/xtwy# ls
demo Documents examples.desktop Pictures Templates
Desktop Downloads Music Public Videos
root@ubuntu:/home/xtwy# rmdir demo
//原来文件夹的demo文件夹已经不存在了
root@ubuntu:/home/xtwy# cd /home/max/
root@ubuntu:/home/max# ls
names
(五) 拷贝文件夹 cp
前面用mv命令移动文件夹,有时候须要对文件夹进行拷贝,使用方式例如以下:
//先创建一个演示文件夹。用-p,父文件夹假设不存在将会被创建
root@ubuntu:/home/max# mkdir -p literature/demo
//由于literature还包含子文件夹,此时拷贝不成功
root@ubuntu:/home/max# cp literature/ /home/xtwy/
cp: omitting directory `literature/'
//假设包含子文件夹的话,则加上-r參数,表示递归地拷贝
root@ubuntu:/home/max# cp -r literature/ /home/xtwy/
root@ubuntu:/home/max# cd /homt
bash: cd: /homt: No such file or directory
root@ubuntu:/home/max# cd /home/xtwy/
root@ubuntu:/home/xtwy# ls
Desktop Downloads literature Pictures Templates
Documents examples.desktop Music Public Videos
root@ubuntu:/home/xtwy# cd literature/
root@ubuntu:/home/xtwy/literature# ls
demo
4. 文件操作
(一) 创建文件
直接通过命令行的方式创建文件的方式有多种,常常使用方式例如以下:
//通过echo命令。将输出的命令重定向到文件
root@ubuntu:/home/xtwy# echo "hello linux" > hello.txt
root@ubuntu:/home/xtwy# ls
Desktop Downloads hello.txt Music Public Videos
Documents examples.desktop literature Pictures Templates
//touch命令。怎样文件不存在。会创建文件
root@ubuntu:/home/xtwy# touch hell1.txt
root@ubuntu:/home/xtwy# ls
Desktop Downloads hell1.txt literature Pictures Templates
Documents examples.desktop hello.txt Music Public Videos
(二) 显示文件内容
cate命令能够显示文件内容。它的全称是catenate。意思是将单词一个接一个地连接起来
root@ubuntu:/home/xtwy# cat hello.txt
hello linux
cat命令会将文件里全部的内容全部一次性显示出现,比如
root@ubuntu:/home/xtwy# cat /etc/profile
# /etc/profile: system-wide .profile file for the Bourne shell (sh(1))
# and Bourne compatible shells (bash(1), ksh(1), ash(1), ...).
if [ -d /etc/profile.d ]; then
for i in /etc/profile.d/*.sh; do
if [ -r $i ]; then
. $i
fi
done
unset i
......
有时候我们希望能够分屏查看文件内容,此时能够使用less或more分页程序。less和more的使用方式相差不大,通过空格键显示下一屏信息,它们之间的区别在于less在文件末尾会显示END消息,而more直接返回shell终端。比如:
less命令
more命令
(三) cp命令拷贝文件
root@ubuntu:/home/xtwy# ls
Desktop Downloads hell1.txt literature Pictures Templates
Documents examples.desktop hello.txt Music Public Videos
//拷贝文件
root@ubuntu:/home/xtwy# cp hell1.txt literature/demo
root@ubuntu:/home/xtwy# cd literature/demo
//cd -返回上一次运行的工作文件夹
root@ubuntu:/home/xtwy/literature/demo# cd -
/home/xtwy
须要注意的是cp命令在复制时,假设目标文件夹中已存在该文件,系统不会给出警告,而是直接覆盖。因此它可能存在销毁文件的风险,为解决问题能够使用-i參数让系统给出警告,比如:
root@ubuntu:/home/xtwy# cp -i hell1.txt literature/demo
cp: overwrite `literature/demo/hell1.txt'?
(三) mv命令移动或重命名文件
//在同一文件夹时,相当于文件重命名,运行完毕后hell1.txt不存在
root@ubuntu:/home/xtwy# mv hell1.txt hell2.txt
root@ubuntu:/home/xtwy# ls
Desktop Downloads hell2.txt literature Pictures Templates
Documents examples.desktop hello.txt Music Public Videos
//移动hell2.txt到literature/demo
root@ubuntu:/home/xtwy# mv hell2.txt literature/demo
root@ubuntu:/home/xtwy# cd literature/demo/
root@ubuntu:/home/xtwy/literature/demo# ls
hell1.txt hell2.txt
root@ubuntu:/home/xtwy/literature/demo# cd -
/home/xtwy
//源文件夹hell2.txt已不存在
root@ubuntu:/home/xtwy# ls
Desktop Downloads hello.txt Music Public Videos
Documents examples.desktop literature Pictures Templates
(四)显示文件头部或尾部
显示文件头部内容用head命令。尾部用tail命令,默认显示行数为10
root@ubuntu:/home/xtwy# head ~/.bashrc
# ~/.bashrc: executed by bash(1) for non-login shells.
# see /usr/share/doc/bash/examples/startup-files (in the package bash-doc)
# for examples
# If not running interactively, don't do anything
[ -z "$PS1" ] && return
# don't put duplicate lines in the history. See bash(1) for more options
# ... or force ignoredups and ignorespace
HISTCONTROL=ignoredups:ignorespace
root@ubuntu:/home/xtwy# tail ~/.bashrc
if [ -f ~/.bash_aliases ]; then
. ~/.bash_aliases
fi
# enable programmable completion features (you don't need to enable
# this, if it's already enabled in /etc/bash.bashrc and /etc/profile
# sources /etc/bash.bashrc).
#if [ -f /etc/bash_completion ] && ! shopt -oq posix; then
# . /etc/bash_completion
#fi
head及tail的默认行数是能够改动的,比如:
//仅显示前两行
root@ubuntu:/home/xtwy# head -2 ~/.bashrc
# ~/.bashrc: executed by bash(1) for non-login shells.
# see /usr/share/doc/bash/examples/startup-files (in the package bash-doc)
tail命令在查看日志文件内容增长时可能常常会使用,比如在hadoop启动之后,会产生很多日志,但出现故障时,能够採用tail命令动态地监測日志文件内容的增长。查看问题出在哪个地方。
//初始显示情况
root@ubuntu:/home/xtwy# tail -f hello.txt
hello linux
//向文件里追加内容
root@ubuntu:/home/xtwy# echo "hello linux linux" >> hello.txt
//追加后的输出情况
root@ubuntu:/home/xtwy# tail -f hello.txt
hello linux
hello linux linux
(五)其他常见文件操作命令
以下的命令都不会改变文件内容
root@ubuntu:/home/xtwy# cp hello.txt hello1.txt
root@ubuntu:/home/xtwy# ls
Desktop Downloads hello1.txt literature Pictures Templates
Documents examples.desktop hello.txt Music Public Videos
//依据文件内容排序
root@ubuntu:/home/xtwy# sort hello1.txt
hello linux
hello linux linux
//逆序输出
root@ubuntu:/home/xtwy# sort -r hello1.txt
hello linux linux
hello linux
//diff进行内容比較
root@ubuntu:/home/xtwy# diff hello1.txt hello.txt
//向文件里追加内容
root@ubuntu:/home/xtwy# echo "hello linux linux" >> hello.txt
//内容比較
root@ubuntu:/home/xtwy# diff hello1.txt hello.txt
2a3
> hello linux linux
//格式化输出
//-u參数将文件分成多块
//比較的两个文件分别用-、+表示
//本例中 -表示hello1.txt,+表示hello.txt
root@ubuntu:/home/xtwy# diff -u hello1.txt hello.txt
--- hello1.txt 2015-08-22 17:28:44.071202558 -0700
+++ hello.txt 2015-08-22 17:29:49.131181281 -0700
//@@xxx@@用于标识行起始编号、行数
//-1,2表示 hello1.txt文件起始编号为1,行数为2
//+1,3表示 hello.txt文件起始编号为1。行数为3
@@ -1,2 +1,3 @@
hello linux
hello linux linux
+hello linux linux
加入公众微信号。能够了解很多其他最新Spark、Scala相关技术资讯
Spark修炼之道(基础篇)——Linux大数据开发基础:第二节:Linux文件系统、文件夹(一)的更多相关文章
- Spark修炼之道(基础篇)——Linux大数据开发基础:第三节:用户和组
本节主要内容 理解用户和组的概念 用户管理 组管理 权限分配 1. 理解用户和组的概念 在第一讲中我们提到.linux是一种多任务.多用户的操作系统,在讲ls -l命令行我们看到例如以下文件具体信息: ...
- Spark修炼之道——Spark学习路线、课程大纲
课程内容 Spark修炼之道(基础篇)--Linux基础(15讲).Akka分布式编程(8讲) Spark修炼之道(进阶篇)--Spark入门到精通(30讲) Spark修炼之道(实战篇)--Spar ...
- 大数据开发-Spark-拷问灵魂的5个问题
1.Spark计算依赖内存,如果目前只有10g内存,但是需要将500G的文件排序并输出,需要如何操作? ①.把磁盘上的500G数据分割为100块(chunks),每份5GB.(注意,要留一些系统空间! ...
- Linux 网络协议栈开发基础篇—— 网桥br0
一.桥接的概念 简单来说,桥接就是把一台机器上的若干个网络接口"连接"起来.其结果是,其中一个网口收到的报文会被复制给其他网口并发送出去.以使得网口之间的报文能够互相转发. 交换机 ...
- 一篇了解大数据架构及Hadoop生态圈
一篇了解大数据架构及Hadoop生态圈 阅读建议,有一定基础的阅读顺序为1,2,3,4节,没有基础的阅读顺序为2,3,4,1节. 第一节 集群规划 大数据集群规划(以CDH集群为例),参考链接: ht ...
- JavaEE 学大数据是否掌握 JavaSE 和 Linux 就够了?
引言 如果你是学习大数据的童靴,可能经常在网上看到一些公众号或博客告诉你,学习大数据基础部分只需要掌握 JavaSE 和 Linux 就够了,至于 JavaWeb 和 JavaEE 简单了解一下就可以 ...
- 大数据入门基础系列之Hadoop1.X、Hadoop2.X和Hadoop3.X的多维度区别详解(博主推荐)
不多说,直接上干货! 在前面的博文里,我已经介绍了 大数据入门基础系列之Linux操作系统简介与选择 大数据入门基础系列之虚拟机的下载.安装详解 大数据入门基础系列之Linux的安装详解 大数据入门基 ...
- 大数据开发实战:Spark Streaming流计算开发
1.背景介绍 Storm以及离线数据平台的MapReduce和Hive构成了Hadoop生态对实时和离线数据处理的一套完整处理解决方案.除了此套解决方案之外,还有一种非常流行的而且完整的离线和 实时数 ...
- Spark 介绍(基于内存计算的大数据并行计算框架)
Spark 介绍(基于内存计算的大数据并行计算框架) Hadoop与Spark 行业广泛使用Hadoop来分析他们的数据集.原因是Hadoop框架基于一个简单的编程模型(MapReduce),它支持 ...
随机推荐
- Oracle11g 审计介绍
审计是记录数据库上方方面面操作.事件等信息,是数据安全管理的重要手段. 开启审计,虽然不同级别的审计会有不同,但是对数据库的性能是有影响的,并且占用存储空间. --1.创建审计数据专用表空间 crea ...
- jquery 微信端 点击物理返回按钮,弹出提示框
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- CE工具里自带的学习工具--第三关
图解: 重复第5,6,7,8,9步,最终得到:
- GET方法与POST方法的区别
区别一:get重点在从服务器上获取资源,post重点在向服务器发送数据: 区别二:get传输数据是通过URL请求,以field(字段)= value的形式,置于URL后,并用"?" ...
- h5编写帧动画
var requestAnimationFrame = window.requestAnimationFrame || window.webkitRequestAnimationFrame; var ...
- ubuntu12.04 配置apache+modwsgi+django1.5
1.首先下载modwsgi 链接如下: http://files.cnblogs.com/baoyiluo/mod_wsgi-3.4.zip 2.解压并安装mod_wsgi: ./configure ...
- 2. 区分散列的 undef 值, 和手动赋值 0 不一样。1. 使用exists函数,散列中有这个键(必须是keys %hash 有这结果),则返回真值,
2. 123 my %vertical_alignment; 124 $vertical_alignment{"subscripting"} = 0; 125 unle ...
- PHP 下基于 php-amqp 扩展的 RabbitMQ 简单用例 (五) -- 自动 ACK、手动 ACK、NACK
以 Direct 类型的 交换机和 Queue 的 get 方法为例. producer.php // 连接设置 $conConfig = [ 'host' => '127.0.0.1', 'p ...
- 如何HTML标签和JS中设置CSS3 var变量
一.HTML标签中设置CSS变量 如下: <div style="--color: #cd0000;"> <img src="mm.jpg" ...
- 笔试算法题(53):四种基本排序方法的性能特征(Selection,Insertion,Bubble,Shell)
四种基本算法概述: 基本排序:选择,插入,冒泡,希尔.上述算法适用于小规模文件和特殊文件的排序,并不适合大规模随机排序的文件.前三种算法的执行时间与N2成正比,希尔算法的执行时间与N3/2(或更快)成 ...