linux文本处理三剑客(一)---grep
在linux种有一句话,叫做一切皆文件。文件有个特点,它是个文本。它可以读、可以写,如果是二进制文件,它还能执行。这样的话,我们在使用linux的时候,多数时间都是要和各式各样文件打交道的。那么,熟悉文本的读取、编辑、筛选就是linux系统管理员的必备技能。
幸而,在linux中,有三个很牛逼的文本处理工具。它们分别是:grep、sed、awk。下面我们用三篇文章来简单讲讲他们仨。
第一个登场的,是grep。它是(global search regular expression and print out the line,全面搜索正则表达式并将其打印到命令行)的缩写。它是以行来进行搜索的,同时,以行进行输出。它可以直接使用,也可以通过管道符(“|”)来与其他命令混合使用,达到更好的切割文本的效果。
基本用法:
grep “选项“ ”模式“ 文件
其中,”选项“是指常用的几种功能,”模式“指要搜的正则表达式,文件则代表搜索对象。
下面一个一个介绍:
* 常用的一些功能选项:
-v: 显示版本号
-E: 默认模式为扩展正则表达式,相当于使用了egrep
-F: 默认模式为固定字符串列表,相当于使用了fgrep
-n: 输出行数
-v: 反向查找
-i: 忽略大小写
-o:只显示被选中的表达式,不显示整行
-w: 匹配整词,精确的单词,不是模糊匹配。单词的两边必须是非字符符号,以保证中间是一个完整的单词。
-A 行数:匹配到搜索行以及该行下面n行
-B 行数:匹配到搜索行以及该行上面n行
-C 行数:匹配到搜索行以及该行上下n行
* 常用的一些模式介绍:
‘^$’:空行
‘.‘: 任意一个字符
[xyz]: x、y、z任意一个
[[:space:]]: 空格及tab
[a-zA-Z]: 相当于[[:alpha:]]
[^123]:除了123以外的字符,这里的^和通配符里边的"^"意义完全不一样,且在正则表达式中,这些符号的意义与通配符中的意义完全不一样。如果按照通配符的标准来学习正则表达式,那就GG了~
[a-zA-Z0-9]: 相当于[[:alnum:]]
[A-Z]: 相当于[[:UPPER:]]
[a-z]: 相当于[[:lower:]]
[[:punct:]]: 相当于标点符号
下面举几个例子,来演示以下它们怎么使用:
我在/tmp下建立了一个test_file,抄了Bob Dylan的《make you feel my love》进去。我们来测试:
1) cat test_file|grep -w 'love',精准查找关键词'love'.
2) cat test_file|grep -v 'feel my love',grep不会打印带有'feel my love'的行。
3)cat test_file |grep -A 5 'love',grep会打印找到的love行,并其下边的5行一起打印。
4)cat test_file|grep -n '^$',输出空格行行数;若想去除空格行,可以使用grep -v '^$';若想去除注释行,可用egrep -v '#'。
5) 去除/etc/ssh/sshd_config的空格和注释,并打印行数。其中,-v表示反向输出;-E表示使用扩展正则表达式;-n表示输出行数。而'^#|^$'则表示,以"#"开头的注释和空行。|表示“或”的意思。
linux文本处理三剑客(一)---grep的更多相关文章
- Linux文本处理三剑客之grep及正则表达式详解
Linux文本处理三剑客之grep及正则表达式详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Linux文本处理三剑客概述 grep: 全称:"Global se ...
- Linux文本处理三剑客之——grep
一Linux文本处理三剑客之——grep Linux文本处理三剑客都支持正则表达式 grep :文本过滤( 模式:pattern) 工具,包括grep, egrep, fgrep (不支持正则表达式) ...
- Linux 文本处理三剑客之grep
文本处理都要使用正则表达式,正则表达式有: 基本正则表达式:grep或者egrep -G 扩展正则表达式:egreo或者grep -E Linux 文本处理三剑客: sed:stream editor ...
- linux文本处理三剑客之 grep
文本处理无非是对文本内容做查看.修改等操作.Linux三剑客: grep.sed 和 awk 命令. 处理文本内容,用 Vim 编辑器不是很好吗?Vim 允许我们使用键盘.鼠标来对文本内容进行交互性地 ...
- Linux文本处理三剑客之grep
简介 grep命令,用于在一个文本文件中或者从STDIN中,根据用户给出的模式(pattern)过滤出所需要的信息. grep以及三剑客中的另外两个工具sed和awk都是基于行处理的,它们会一行行读入 ...
- 二、LINUX文本处理三剑客之grep
1. grep一般格式:grep [选项] 基本正则表达式 [文件],其中基本正则表达式需要用引号引起来 引号引起来的作用:a.防止被误解为shell命令,b.可以用来查找多个单词组成的字符串 gre ...
- Linux文本处理三剑客之sed
推荐新手阅读[酷壳]或[骏马金龙]开篇的教程作为入门.骏马兄后面的文章以及官方英文文档较难. [酷壳]:https://coolshell.cn/articles/9104.html [骏马金龙-博客 ...
- 关于Linux文本处理“三剑客”的一些小操作。
Linux文本处理“三剑客”,即grep.sed.awk,这是Linux中最核心 的3个命令. 一.首先做个简单的介绍: 1.awk:linux三剑客老大,过滤,输出内容,一门语言.NR代表行号. 2 ...
- 文本处理三剑客之 grep
grep简介 grep(Global search REgular expression and Print out the line)是Linux上的文本处理三剑客之一,另外两个是sed和awk. ...
- shell 文本处理三剑客之 grep 和 egrep
shell 三剑客之 grep 命令语法格式 grep 参数 案例 显示file中有python的行 grep python file 显示没有python的行,不忽略大小写 grep -v pyth ...
随机推荐
- 在多语句事务内不允许使用 CREATE DATABASE 语句。
方法一:create database [ 项目名称] 方法二:update-database -verbose
- 如何实现对ArrayList排序 sort()
package com.collection; import java.util.ArrayList;import java.util.Collections;import java.util.Com ...
- 薛的lca讲课配到题解
2.15 LCA Nearest Common Ancestors POJ 1330 题意:给出一棵树, 询问两个点的最近公共祖先. 思路: $LCA$模板题,请各位掏出各式各样的模板A穿它. #in ...
- sync、fsync和fdatasync
转自 http://blog.csdn.net/todd911/article/details/11701847 传统的UNIX实现在内核中设有缓冲区高速缓存或页面高速缓存,大多数磁盘 I/O都通过缓 ...
- Luogu5298 [PKUWC2018]Minimax
太久没写博客了,过来水一发. 题目链接:洛谷 首先我们想到,考虑每个叶节点的权值为根节点权值的概率.首先要将叶节点权值离散化. 假设现在是$x$节点,令$f_i,g_i$分别表示左/右节点的权值$=i ...
- Driver对 (一对两对的对):specific/mini VS general
老是听说miniport,port,在这里算是搞清楚了.mini就是specific(特殊)的意思.在微软的驱动层次里面,最底层的一般都是比较特殊的,但是为了满足系统的可拓展.可维护.通用等要求,微软 ...
- JS合并多个数组去重算法
var arr1 = ['a','b']; var arr2 = ['a','c','d']; var arr3 = [1,'d',undefined,true,null]; //合并两个数组,去重 ...
- Flume-自定义 Source 读取 MySQL 数据
开源实现:https://github.com/keedio/flume-ng-sql-source 这里记录的是自己手动实现. 测试中要读取的表 CREATE TABLE `student` ( ` ...
- poj1734
Sightseeing trip Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9078 Accepted: 3380 ...
- [Java读书笔记] Effective Java(Third Edition) 第 6 章 枚举和注解
Java支持两种引用类型的特殊用途的系列:一种称为枚举类型(enum type)的类和一种称为注解类型(annotation type)的接口. 第34条:用enum代替int常量 枚举是其合法值由一 ...