大数据之Linux进阶指令

1.文件内容操作相关命令

　　cut 根据条件从命令结果中提取对应内容

　　　　-c 　　按字符选取内容

　　例子：head -2 1.txt | cut -c 5 截取前两行的第五个字符

　　　　-d '分隔符' 　　指定分隔符

　　　　-f n1,n2 　　　分割以后显示第几段内容, 使用（,）拼接

　　　　　也可以写成 -f 1,2 或者 -f 1-2

　　例子：head -2 1.txt | cut -d ':' -f 1,2 读取前两行内容后按照：切割显示第一段和第二段内容

　　sort　可针对文本文件的内容，以行为单位来排序。　

　　　　文件名　　对文件内容按照字符排序

　　　　-u　　　　对文件内容按照字符排序并去重

　　　　-n　　　　按照数值大小排序

　　　　-r　　　　　使次序颠倒

　　　　-t　　　　指定字段分隔符

　　　　-k　　　　配合切割字符使用，切割后显示第几列，并根据那一列排序

　　例子：sort -t ',' -k2nr score.txt 根据第二段成绩进行倒序显示所有内容

　　wc显示指定文件字节数, 单词数, 行数信息.

　　　　文件名　　显示指定文件字节数, 单词数, 行数信息.多个文件用空格拼接

　　　　-c 　　　　只显示bytes 字节数

　　　　-w 　　　只显示words 单词数

　　　　-l 　　　　只显示lines 行数

　　uniq用于检查及删除文本文件中重复出现的行，一般与 sort 命令结合使用。

　　　　-c　　　　统计每行内容出现的次数

　　例子：cat 5.txt | sort | uniq -c 显示去重后的数据并且在行头显示出现的个数

　　tee可以将命令结果通过管道输出到多个文件中

　　例子：cat 5.txt | sort | uniq -c | tee a.txt b.txt c.txt 　将去重统计的结果放到 a.txt、b.txt、c.txx 文件中

　　tr用于替换或删除文件中的字符。

　　例子：echo "itheima" | tr 'i' 'I' 将小写i 替换成大写 I

　　　　-d 字符　　删除指定的内容

　　例子：echo 'abc1d4e5f' | tr -d '[0-9]' 删除abc1d4e5f中的数字

　　split将大文件切分成若干小文件

　　　　-b [bytes] 　　将大文件切分成若干bytes的小文件 (如10K)支持K M G 的简写

　　　　 -l [lines]　　将大文件切分成若干行的小文件

　　awk实现模糊查询, 按需提取字段, 还可以进行判断和简单的运算等.

　　　　-F 　　　　　分割符后面跟要根据什么字符分割

　　　　$ + 数字　　获取第几段内容

　　　　$0 　　　　获取当前行内容

　　　　NF 　　　　表示当前行共有多少个字段

　　　　$NF 　　　代表最后一个字段

　　　　$(NF-1) 　代表倒数第二个字段

　　　　NR 　　　代表处理的是第几行

　　　　OFS="字符" 向外输出时的 段分割字符串

　　　　'{print $1, $2, $3}' 　　打印第一段，第二段，第三段，配合分割使用

　　　　toupper() 　　　　　　字符转成大写

　　　　tolower() 　　　　　　字符转成小写

　　　　length() 　　　　　　返回字符长度

　　　　'BEGIN{初始化操作}{每行都执行} END{结束时操作}'

　　例子：awk -F ',' '{if($4>60) print $1, $4, "及格"; else print $1, $4, "不及格"}' score.txt 如果第四段成绩大于60；打印第一段姓名，第四段成绩，及格否则打印打印第一段姓名，第四段成绩，不及格

　　例子：awk -F ',' 'BEGIN{}{total=total+$4}END{print total, NR, (total/NR)}' score.txt 求平均分，Begin{}{求所有人的成绩的和}END{打印总成绩，总人数，平均分}

　　 sed通过 sed 可以实现过滤和替换的功能

　　　　p 　　　　　　打印

　　　　$ 　　　　　　代表最后一行

　　　　-n 　　　　　仅显示处理后的结果

　　　　-e 　　　　　根据表达式进行处理

　　例子：sed -n -e '1,5p' 1.txt 列出 1.txt的 1~5行的数据

　　例子：sed -n -e '/root/p' 1.txt 查找01.txt中包含root行

2:文件解压压缩相关命令

　　# 压缩文件

　　tar -zcvf 打包压缩文件名.tar.gz 被压缩的文件/目录

# 解压缩文件(记忆敲门: 直销危房)
tar -zxvf 打包文件.tar.gz

# 解压缩到指定路径
tar -zxvf 打包文件.tar.gz -C 目录路径

-z 解压/压缩.gz文件 -j 解压/压缩 bzip2文件

3.VIM编辑器相关命令　　

如果 vi 异常退出, 在磁盘上可能会保存有交换文件.swp文件，再次打开文件时会有提示，如果放弃之前的编辑按D,恢复按R，不管按E

vim 文件名	创建/打开文件没有即创建有即打开	w	保存
vim 文件名 +行数	打开文件并将光标留在指定行	q	退出,如果没有保存,不允许退出
h	光标向左	q!	强行退出,不保存退出
j	光标向下	wq	write & quit 保存且退出
k	光标向上	x	保存并退出
l	光标向右	ZZ	保存并退出
w	向后移动一个单词	0	行首
b	向前移动一个单词	^	行首, 第一个不是空白字符的位置
gg	文件顶部	$	行尾
数字G	移动到数字对应行数	Ctrl + b	向上翻页
: 数字	移动到数字对应的行数	Ctrl + f	向下翻页
{	上一段	H	屏幕顶部
}	下一段	M	屏幕中间
%	括号匹配及切换	L	屏幕底部
mx	添加编辑x, x是a~z 或者 A~Z的任意一个字母	'x	直接定位到标记x所在的位置
u	撤销上次的命令(ctrl + z)	Ctrl + r	恢复撤销的命令
x	删除光标所在的字符,或者选中的文字	d(移动命令)	删除移动命令对应的内容/剪切
dd	删除至行尾/剪切	d0	从光标位置删除到一行的起始位置
dw	从光标位置删除到单词末尾	d}	从光标位置删除到段落末尾
ndd	从光标位置向下连续删除 n 行	d'a	从光标所在行删除到标记a 之间的所有代码
y	复制	yy	复制一行,可以nyy复制多行
p	粘贴	.	重复上次命令
r	替换当前字符命令模式	R	替换当前行光标后的字符替换模式
>>	向右增加缩进	<<	向左减少缩进
/str	查找str	*	向后查找当前光标所在单词
#	向前查找当前光标所在单词	:%s/旧文本/新文本/g	替换文件中的所有出现的旧文本
i	在当前字符前插入文本	I	在行首插入文本
a	在当前字符后添加文本	A	在行末添加文本
o	在当前行后面插入一空行	O	在当前行前面插入一空行

大数据之Linux进阶指令的更多相关文章

大数据之Linux基本指令
1:文件操作类指令 ls 是英文单词list 的简写, 其功能为列出目录的内容,是最常用的命令之一 -a all 显示指定目录下所有子目录与文件, 包含隐藏文件 -l 以列表方式显示文件的详细信息 - ...
Linux进阶指令（重点）
三.Linux进阶指令(重点) 1.df指令作用:查看磁盘的空间 #df -h 选项:-h 表示以可读性较高的形式展示大小 2.free指令作用:查看内存使用情况 #free ...
一起来学大数据——走进Linux之门，学习大数据的重中之重
昨天我们看了有关大数据Hadoop的一些知识点,但是要在学习大数据之前,我们还是要为大数据的环境做一些的部署. 那么,今天我们就来讲讲开启我们大数据之路的Linux,跟上我们的脚步yo~ Linux介 ...
大数据之Linux基础
回顾这一个多月以来闭关学大数据的一些相关重要知识,就当复习,顺便以备以后查看 Linux学习第一步自然是安装Linux. 关于Linux 首先介绍下Linux,Linux系统很多程序员开发者其实都耳熟 ...
大数据开发-linux后台运行，关闭，查看后台任务
在日常开发过程中,除了例行调度的任务和直接在开发环境下比如Scripts,开发,很多情况下是shell下直接搞起(小公司一般是这样),看一下常见的linux后台运行和关闭的命令,这里做一个总结,主要包 ...
大数据开发-linux下常见问题详解
1.user ss is currently user by process 3234 问题原因:root --> ss --> root 栈递归一样解决方式:exit 退出当前到ss再 ...
【大数据】Linux下安装Hadoop(2.7.1)详解及WordCount运行
一.引言在完成了Storm的环境配置之后,想着鼓捣一下Hadoop的安装,网上面的教程好多,但是没有一个特别切合的,所以在安装的过程中还是遇到了很多的麻烦,并且最后不断的查阅资料,终于解决了问题,感 ...
【大数据】Linux下Storm（0.9版本以上）的环境配置和小Demo
一.引言: 在storm发布到0.9.x以后,配置storm将会变得简单很多,也就是只需要配置zookeeper和storm即可,而不再需要配置zeromq和jzmq,由于网上面的storm配置绝大部 ...
大数据之Linux网卡配置
当你安装好一台Linux之后,第一步自然是配置网卡,让你的Linux上网. 配置网卡大多数有两种模式,一种是桥接,一种是NAT 首先讲一下桥接网卡的上网原理,他是等同于在你现有的网络环境上直接现加一台 ...

随机推荐

PHP获取PHP执行的时间
php获取PHP执行的时间 <pre> //程序运行时间 $starttime = explode(' ',microtime()); //代码区域 //程序运行时间 $endtime = ...
China .NET Conf 2019-.NET技术架构下的混沌工程实践
这个月的8号.9号,个人很荣幸参加了China.NET Conf 2019 , 中国.NET开发者峰会,同时分享了技术专题<.NET技术架构下的混沌工程实践>,给广大的.NET开发小伙伴介 ...
avtivmq（订阅写法）
发布-订阅消息模式与点对点模式类似,只不过在session创建消息队列时,由session.createQuene()变为session.createTopic(). 消息发布者代码: 消息订阅者代码 ...
大宇java面试系列（二）：jvm组成部分
1. 说一下 JVM 的主要组成部分?及其作用? 类加载器(ClassLoader) 运行时数据区(Runtime Data Area) 执行引擎(Execution Engine) 本地库接口(Na ...
Python多线程与队列
Python多线程与Queue队列多线程在感官上类似于同时执行多个程序,虽然由于GIL的存在,在Python中无法实现线程的真正并行,但是对于某些场景,多线程仍不失为一个有效的处理方法: 1,不紧急的 ...
lqb 基础练习特殊的数字
基础练习特殊的数字时间限制:1.0s 内存限制:512.0MB 问题描述 153是一个非常特殊的数,它等于它的每位数字的立方和,即153=1*1*1+5*5*5+3*3*3.编程求所有 ...
nyoj 125-盗梦空间 (数学ans += temp * 60 * pow(0.05, cnt))
125-盗梦空间内存限制:64MB 时间限制:3000ms 特判: No 通过数:8 提交数:10 难度:2 题目描述: <盗梦空间>是一部精彩的影片,在这部电影里,Cobb等人可以进入 ...
力扣（LeetCode）亲密字符串个人题解
给定两个由小写字母构成的字符串 A 和 B ,只要我们可以通过交换 A 中的两个字母得到与 B 相等的结果,就返回 true :否则返回 false . 示例 1: 输入: A = "ab& ...
opencv 5 图像转换(1 边缘检测）
边缘检测一般步骤 canny算子步骤 canny函数彩色canny #include<opencv2/opencv.hpp> #include<opencv2/highgui/ ...
在 Vue中使用layui日历控件，标注重要日子
因为在vue文件中通过import加载,不知道为什么打包后会找不到js, 所以通过这种方法引入在index.html中引入文件目录需要放在static目录下 <input type=&qu ...

大数据之Linux进阶指令

大数据之Linux进阶指令的更多相关文章

随机推荐

热门专题