文本搜索工具:grep, egrep
    根据用户指定的模式对目标文件进行过滤,显示被模式匹配到的行
    grep [OPTION]... 'PATTERN' FILE...
          --color
   
    难点在于模式如何书写,模式主要是应用正则表达式
    正则表达式:由一类字符书写的模式,其中有些字符不表示字符的字面意义,
                而是表示控制或者统配的功能
        元字符:*, ?等
        两类:
            基本正则表达式
            扩展正则表达式
       
    基本正则表达式:
        字符匹配:
            .: 匹配任意单个字符
                例如:grep --color 'r..t' /etc/passwd
                        匹配到r开头,t结尾,中间间隔两个字符的行
           
            []:匹配指定集合中任意单个字符
                [[:digit:]],[0-9]
                [[:lower:]],[a-z]
                [[:upper:]],[A-Z]
                [[:alpha:]],[a-zA-Z]
                [[:alnum:]],[0-9a-zA-Z]
                [[:space:]]
                [[:punct:]]
                例如:grep --color 'abcd[[:digit:]][[:digit:]][0-9]' test
                        匹配以abcd开头,后边跟三个数字的行
               
            [^]:匹配指定集合外的任意单个字符           
                    例如:grep --color 'abcd[^[:digit:]]' test
                          grep --color 'abcd[^0-9]' test
                            匹配以abcd开头,后边不是数字的行
       
        匹配次数:用于对其前面紧邻的字符所能够出现的次数作出限定
            *:匹配其前面的字符任意次,0,1或多次
                例如:grep 'x*y'
                        xy,xxy,xxxy,y
                   
            \?:匹配其前面的字符0次或1次,其中的\为转义字符,即转移?
                例如:grep 'x\?y'
                        xy,xxy,y,xxxy,aby 对于xxy而言,确实匹配到了xy,第一个x是被忽略的
           
            \+:匹配其前面的字符出现至少一次
                例如:grep 'x\+y'
                        xy,xxy,xxxy
           
            \{m\}:匹配前面字符m次
                例如:grep 'x\{2\}y'
                        xxy,xxxy
           
            \{m,n\}:匹配其前面字符至少出现m次,至多出现n次
                例如:grep 'x\{2,4\}y'
                        xxy, xxxy
                      grep 'x\{2,\}y'
                        xxy,xxxy
           
            .*:匹配任意长度的任意字符
       
        位置锚定:
            ^: 行首锚定
                写在模式的最左侧
                例如:grep --color '^abcd' /etc/passwd
                        匹配以abcd开头的行
               
            $: 行尾锚定
                写在模式的最右侧
                例如:grep --color '[0-9]$' /etc/passwd
                        匹配以数字结尾的行
               
            ^$:空白行
                例如:grep --color '^$' /etc/passwd
                        匹配空白行
           
            \<: 词首锚定, \b, \为转义字符
                出现在要查找的单词模式的左侧,\<char
                例如:grep --color '\<r' /etc/passwd
                        匹配以r开头的单词
               
            \>: 词尾锚定, \b,\为转义字符
                出现在要查找的单词模式的右侧,char\>
                例如:grep --color 'tor\>' /etc/passwd
                        匹配以tor结尾的单词
               
            \<pattern\>:匹配单词
                例如:grep --color '\<root\>' /etc/passwd
                        匹配单词root
       
        分组:
            \(\)
            后向引用:模式中,如果使用\(\)实现了分组,在某行文本的检查中,
                    如果\(\)的模式匹配到了某内容,此内容后面的模式中可以被引用;
                \1,\2,\3
                模式自左向右,引用第#个左括号以及与其匹配右括号之间的模式匹配到的内容
               
            例如:grep --color 'ab\{1,\}y' test
                    a与y之间至少一次b
                  grep --color '\(ab\)\{1,\}y' test
                    y之前至少一次ab
                  grep --color '\(ab\)\{1,\}y\1' test
                    y之前至少一次ab,且后边引用第一个分组
                  grep --color '\(ab\)\{1,\}y\2' test
                    y之前至少一次ab,且后边引用第二个分组
               
    grep选项:
        -v: 反向选取,即显示模式匹配之外的行
            例如:grep -v --color 'abcd' test
                    显示abcd之外的行
        -o: 仅显示匹配到的内容
        -i: 忽略字符大小写
        -n: 匹配的同时显示行号
        -E: 使用扩展正则表达式
        -A #:匹配到的下边#行
            例如:grep -A 2 --color 'abcd' test
                    显示匹配abcd的行及其下边两行,共三行
        -B #:匹配到的上边#行
        -C #:匹配到的上下边#行
   
    egrep及扩展的正则表达式
        扩展正则表达式的元字符
            字符匹配:
                .
                []
                [^]
               
            匹配次数限定:
                *
                ?: 匹配其前面字符0次或1次
                +:匹配其前面字符至少1次
                {m}:匹配其前面字符m次
                {m,n}:{m,},{0,n}
           
            锚定:
                ^
                $
                \<, \>: \b
           
            分组:
                ()
                支持后向引用:\1, \2...
           
            或者:
                a|b: a或者b
                ab|cd:
                例如: egrep --color 'ab|c' test
                       grep --color 'ab\|c' test
                        匹配含有ab或者c的行
                       grep --color 'a\(b\|c\)' test
                        匹配含有ab或者ac的行
                       
        例如:grep -E 'PATTERN' FILE...
              egrep 'PATTERN' FILE...

文本搜索grep知识点总结的更多相关文章

  1. CentOS 文本搜索grep

    grep 用于在文本中执行关键词搜索, 用法: grep [选项]... PATTERN [FILE]... [root@bigdata-senior01 ~]# grep "ftp&quo ...

  2. 整理grep实战文本搜索过滤技巧

    一:grep的简介: 文本搜索工具,根据用户指定的文本模式对目标文件进行逐行搜索,显示能够被模式所匹配到的行.配合正则表达式的使用可以实现强大的文本处理.下面一一说明正则的例子. 二:文本处理工具分类 ...

  3. [linux] grep 文本搜索工具

    grep [option] pattern file Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.grep全称是Global Regular ...

  4. shell脚本学习指南-grep文本搜索命令-学习(3)

    1.作用 Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来.grep全称是Global Regular Expression Print,表示全 ...

  5. grep文本搜索工具详解

    ############grep命令############这个命令属于文本处理三大命令之一,强大的文本搜索工具(贪婪模式)全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达 ...

  6. 二、grep文本搜索工具

    grep命令作为Unix中用于文本搜索的神奇工具,能够接受正则表达式,生成各种格式的输出.除此外,它还有大量有趣的选项. # 搜索包含特定模式的文本行: [root@centos8 ~]#grep p ...

  7. 基于文本图形(ncurses)的文本搜索工具 ncgrep

    背景 作为一个VIM党,日常工作开发中,会经常利用grep进行关键词搜索,以快速定位到文件.如图: 利用grep进行文本搜索 但是,这一过程会有两个效率问题: 展示的结果无法进行直接交互,需要手动粘贴 ...

  8. linux下的文本操作之 文本查找——grep

    摘要:你有没有这样的应用场景:调试一个程序,出现debug的提示信息,现在你需要定位是哪个文件包含了这个debug信息,也就是说,你需要在一个目录下的多个文件(可能包含子目录)中查找某个字符串的位置: ...

  9. (办公)记事本_grep文本搜索命令

    参考谷粒学院的linux视频教程:http://www.gulixueyuan.com/course/300/task/7091/show grep文本搜索命令:[是一种强大的文本搜索工具,它能使用正 ...

随机推荐

  1. hdu6315( 2018 Multi-University Training Contest 2)

    bryce1010模板 http://acm.hdu.edu.cn/showproblem.php?pid=6315 /*hdu 1007 首先我们在建立线段树之前应该思考的是线段树的节点维护一个什么 ...

  2. 23 在java中使用groovy类

    1       在java中使用groovy类 1.1  直接调用groovy类 在java中调用Groovy类,需要增加Groovy运行时到java的classpath中. pom.xml < ...

  3. LM358与TL431验证

  4. nginx 配置步骤

    D:\myphp2017\nginx\conf.nginx.conf37行 吧localhost 改为www.ff.com41行取消注释44行 加D:\myphp2017\nginx\html45 在 ...

  5. Java设计模式之单例模式 - Singleton

    用来创建独一无二的,是能有一个实例的对象的入场券.告诉你一个好消息,单例模式的类图可以说是所有模式的类图中最简单的,事实上,它的类图上只有一个类!但是,可不要兴奋过头,尽管从类设计的视角来说很简单,但 ...

  6. bootstrap基本组件

    bootstrap分页   <nav>      <ul class="pagination">       <li><a href=&q ...

  7. hdu6118 度度熊的交易计划

    思路: 将生产和运输费用视作产出,将销售获利视作投入,计算最小费用可行流(不一定是最大流).注意片区之间的高速公路是双向边. 实现: #include <iostream> #includ ...

  8. VBA小记

    要放假了,可是我们,我还是煎熬! 最让人不爽的是媳妇也需要加班加点的完成一些看起来很EASY的事: 统计数据,把几个表合并…… EXCEL本人还是懂得一点点的(我不想说我是学计算机的,我怕给学计算机的 ...

  9. Alpha-beta pruning

    function alphabeta(node, depth, α, β, maximizingPlayer) or node is a terminal node return the heuris ...

  10. 程序windows上可以上传附件,部署到 linux服务器后出现 “上传目录 不可写” 怎么解决?

    这样的问题一般都是linux  下文件读写权限引起的,用 shell  命名到上传附件的目录(如 cd /data/www/project/upload/),然后执行 shell 文件权限设置: 例如 ...