每天学点Linux-选取命令CUT和GREP

　　选取命令就是将一段数据经过分析后，取出我们所想要的。或者是经由分析关键词，取得我们所想要的那一行！一般来说，选取命令通常是针对一行一行的数据来进行分析的，并不是整篇信息分析。
cut
　　cut命令可以将一段信息的某一段选取出来，信息处理一行为单位。CUT命令使用格式如下：

[root@www ~]# cut -d'分隔字符' -f fields <==用于有特定分隔字符

[root@www ~]# cut -c 字符区间            <==用于排列整齐的信息

选项与参数：

-d  ：后面接分隔字符。与 -f 一起使用；

-f  ：依据 -d 的分隔字符将一段信息分割成为数段，用 -f 取出第几段的意思；

-c  ：以字符 (characters) 的单位取出固定字符区间；

　　范例一：将 PATH 变量取出，我要找出第五个路径。

[root@www ~]# echo $PATH | cut -d ':' -f 5

# 如同上面的数字显示，我们是以『 : 』作为分隔，因此会出现 /usr/local/bin

# 那么如果想要列出第 3 与第 5 呢？，就是这样：

[root@www ~]# echo $PATH | cut -d ':' -f 3,5

　　范例二：将 export 输出的信息，取得第 12 字符以后的所有字符串

[root@www ~]# export

declare -x HISTSIZE="1000"

declare -x INPUTRC="/etc/inputrc"

declare -x KDEDIR="/usr"

declare -x LANG="zh_TW.big5"

.....(其他省略).....

# 注意看，每个数据都是排列整齐的输出！如果我们不想要『 declare -x 』时，

# 就得这么做：

[root@www ~]# export | cut -c 12-

HISTSIZE="1000"

INPUTRC="/etc/inputrc"

KDEDIR="/usr"

LANG="zh_TW.big5"

　　CUT -d命令适合操作具有固定分割符的文本，用 -c 可以处理比较具有格式的输出数据，还可以指定某个范围的值，例如第 12-20 的字符，就是 cut -c 12-20。cut 主要的用途在于将『同一行里面的数据进行分解！』最常使用在分析一些数据或文字数据的时候！这是因为有时候我们会以某些字符当作分割的参数，然后来将数据加以切割，以取得我们所需要的数据。鸟哥也很常使用这个功能呢！尤其是在分析 log 文件的时候！不过，cut 在处理多空格相连的数据时，可能会比较吃力一点。

grep

　　 cut是将一行信息当中，取出某部分我们想要的，而grep则是分析一行信息，若当中有我们所需要的信息，就将该行拿出来。其使用方法如下：

[root@www ~]# grep [-acinv] [--color=auto] '搜寻字符串' filename

选项与参数：

-a ：将 binary 文件以 text 文件的方式搜寻数据

-c ：计算找到 '搜寻字符串' 的次数

-i ：忽略大小写的不同，所以大小写视为相同

-n ：顺便输出行号

-v ：反向选择，亦即显示出没有 '搜寻字符串' 内容的那一行！

--color=auto ：可以将找到的关键词部分加上颜色的显示喔！

　　具体的操作实例如下：

范例一：将 last 当中，有出现 root 的那一行就取出来；

[root@www ~]# last | grep 'root'

范例二：与范例一相反，只要没有 root 的就取出！

[root@www ~]# last | grep -v 'root'

范例三：在 last 的输出信息中，只要有 root 就取出，并且仅取第一栏

[root@www ~]# last | grep 'root' |cut -d ' ' -f1

# 在取出 root 之后，利用上个命令 cut 的处理，就能够仅取得第一栏啰！

范例四：取出 /etc/man.config 内含 MANPATH 的那几行

[root@www ~]# grep --color=auto 'MANPATH' /etc/man.config

....(前面省略)....

MANPATH_MAP     /usr/X11R6/bin          /usr/X11R6/man

MANPATH_MAP     /usr/bin/X11            /usr/X11R6/man

MANPATH_MAP     /usr/bin/mh             /usr/share/man

排序命令： sort, wc, uniq

　　sort命令可以进行排序，而且可以依据不同的数据型态来排序，排序的字符与语系的编码有关。

[root@www ~]# sort [-fbMnrtuk] [file or stdin]

选项与参数：

-f  ：忽略大小写的差异，例如 A 与 a 视为编码相同；

-b  ：忽略最前面的空格符部分；

-M  ：以月份的名字来排序，例如 JAN, DEC 等等的排序方法；

-n  ：使用『纯数字』进行排序(默认是以文字型态来排序的)；

-r  ：反向排序；

-u  ：就是 uniq ，相同的数据中，仅出现一行代表；

-t  ：分隔符，默认是用 [tab] 键来分隔；

-k  ：以那个区间 (field) 来进行排序的意思

　　范例一：个人账号都记录在 /etc/passwd 下，请将账号进行排序。

[root@www ~]# cat /etc/passwd | sort

adm:x:3:4:adm:/var/adm:/sbin/nologin

apache:x:48:48:Apache:/var/www:/sbin/nologin

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

　　范例二：/etc/passwd 内容是以 : 来分隔的，我想以第三栏来排序，该如何？

[root@www ~]# cat /etc/passwd | sort -t ':' -k 3

root:x:0:0:root:/root:/bin/bash

uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin

operator:x:11:0:operator:/root:/sbin/nologin

bin:x:1:1:bin:/bin:/sbin/nologin

games:x:12:100:games:/usr/games:/sbin/nologin

　　看到特殊字体的输出部分了吧？怎么会这样排列啊？如果是以文字型态来排序的话，原本就会是这样，想要使用数字排序，使用-n来以数字来排序。

# cat /etc/passwd | sort -t ':' -k 3 -n

uniq
　　uniq命令可以用来去除重复的数据，仅仅保留一行，其使用方法如下：

[root@www ~]# uniq [-ic]

选项与参数：

-i  ：忽略大小写字符的不同；

-c  ：进行计数

　　范例一：使用 last 将账号列出，仅取出账号栏，进行排序后仅取出一位；

[root@www ~]# last | cut -d ' ' -f1 | sort | uniq

　　范例二：承上题，如果我还想要知道每个人的登陆总次数呢？

[root@www ~]# last | cut -d ' ' -f1 | sort | uniq -c

      1

     12 reboot

     41 root

      1 wtmp

　　UNIQ这个命令用来将重复的行删除掉只显示一个，举个例子来说，你要知道这个月份登陆你主机的用户有谁，而不在乎他的登陆次数，那么就使用上面的范例， (1)先将所有的数据列出；(2)再将人名独立出来；(3)经过排序；(4)只显示一个！由于这个命令是在将重复的东西减少，所以当然需要『配合排序过的文件』来处理啰！
wc
　　如果想要知道文件里面有多少字？多少行？多少字符的话可以利用 wc 这个命令来达成，WC可以帮我们计算输出的信息的整体数据。其使用方法如下：

[root@www ~]# wc [-lwm]

选项与参数：

-l  ：仅列出行；

-w  ：仅列出多少字(英文单字)；

-m  ：多少字符；

　　范例一：那个 /etc/man.config 里面到底有多少相关字、行、字符数？

[root@www ~]# cat /etc/man.config | wc

    141     722    4617

　　输出的三个数字中，分别代表：行、字数、字符数

每天学点Linux-选取命令CUT和GREP的更多相关文章

Linux管线命令 - cut,grep,sort,uniq,wc,tee,tr,col,join,paste,expand,split,xargs
在每个管线后面接的第一个数据必定是『命令』喔!而且这个命令必须要能够接受 standard input 的数据才行,这样的命令才可以是为『管线命令』,例如 less, more, head, tail ...
Linux常用命令4（grep、df、du、awk、su、ll）
[grep命令] grep常用用法 [root@www ~]# grep [-acinv] [--color=auto] '搜寻字符串' filename选项与参数:-a :将 binary 文件以 ...
linux每日命令(35)：grep命令
Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.grep全称是Global Regular Expression Print,表示全局正则表达 ...
Linux Shell 命令--cut
解读-help 用法:cut [选项]... [文件]... 从每个文件中输出指定部分到标准输出. 长选项必须使用的参数对于短选项时也是必需使用的. -b, --bytes=列表 ...
linux常用命令 cut字符截取命令
cut 字符截取 cut [选项] 文件名选项 -f 列号: 提取第几列 -d 分割符:按照指定的分隔符分割列默认使用制表符("tab")进行分割 ssgao:Download ...
Linux基础命令---cut
cut 将文件中每一行的指定内容显示到标准输出. 此命令的适用范围:RedHat.RHEL.Ubuntu.CentOS.SUSE.openSUSE.Fedora. 1.语法 cut [ ...
『学了就忘』Linux基础命令 — 31、grep命令和通配符
目录 1.grep命令介绍 2.find命令和grep命令的区别(重点) (1)find命令 (2)grep命令 3.通配符与正则表达式的区别 (1)通配符: (2)正则表达式: 1.grep命令介绍 ...
Linux基础命令---显示文本grep
grep 按照指定的模式,在文件中搜索匹配的行,将结果显示在标准输出.另外还有两个指令egrep相当于grep –E,fgrep相当于grep -F.如果没有给出文件名,那么从标准输入读取. 此命令的 ...
Linux高级命令 ==> find、grep、sed、awk
一.find find命令用来在指定目录下查找文件.如果使用该命令时,不设置任何参数,则find命令将在当前目录下查找子目录与文件.并且将查找到的子目录和文件全部进行显示. 语法 find path ...

随机推荐

【整理】Java 10新特性总结
Java 9才发布几个月,很多玩意都没整明白,Java 10就来了..这时候我真尼玛想说:线上用的JDK 7 ,JDK 8 还没用熟,JDK 9 才发布不久不知道啥玩意,JDK 10……刚学Java的 ...
Scrapy基础(六)————Scrapy爬取伯乐在线一通过css和xpath解析文章字段
上次我们介绍了scrapy的安装和加入debug的main文件,这次重要介绍创建的爬虫的基本爬取有用信息通过命令(这篇博文)创建了jobbole这个爬虫,并且生成了jobbole.py这个文件,又写 ...
CC2431 代码分析①-CC2431 喊出第一声
CC2431 是一款可以基于RSSI 定位的芯片. 定位原理,通过RSSI 强度换算距离. 可以打个类似的比方,一个人站在群山之间,每个山头都有一个地理坐标,然后大喊一声,各个方向会返回回声,通过回 ...
php include 绝对路径 dirname(__FILE__)
include(dirname(__FILE__)."/PHPMailer/function.php");
[JOISC2014]友だちをつくろう
[JOISC2014]友だちをつくろう题目大意: 一个\(n(n\le10^5)\)个点,\(m(m\le2\times10^5)\)条边的有向图.对于两个点\(i,j\),如果存在一个点\(k\) ...
最大流：Dinic算法
蒟蒻居然今天第一次写网络流我太弱啦! 最大流问题有很多解法虽然isap常数巨小但是连dinic都写挂的本蒟蒻并不会orz 那么我们选用比较好实现的dinic来解决最大流问题来一段定义: ...
Python中关于列表排序并保留id/enumerate（）使用方法
新手才开始写博客,不周之处请原谅,有错误请指正. >>> a = [1,4,2,5,3]>>> b = sorted(enumerate(a),key = lamb ...
从MongoDB里面取得json格式的数据，然后存为本地的json文件，然后再从json读取变为dict
帮宣传下彩印网(www.caiyin.com) 有印刷,广告等等方面的需求就找这个网站吧,没错的. 天气预报在MongoDB中的天气预报的存储方式是: /* 1 */ { "_id" ...
【数论】Factors of Factorial @upcexam6503
问题 G: Factors of Factorial 时间限制: 1 Sec 内存限制: 128 MB提交: 57 解决: 33[提交][状态][讨论版][命题人:admin] 题目描述 You ...
【想法题】Knot Puzzle @AtCoder Grand Contest 002 C/upcexam5583
时间限制: 2 Sec 内存限制: 256 MB 题目描述 We have N pieces of ropes, numbered 1 through N. The length of piece i ...

每天学点Linux-选取命令CUT和GREP

每天学点Linux-选取命令CUT和GREP的更多相关文章

随机推荐

热门专题