文本处理工具:
    linux上文本处理三剑客
        grep,egrep,fgrep:文本过滤工具(模式:pattern)工具
            grep:默认支持的是基本正则表达式;-E支持扩展正则表达式,-F不支持正则表达式
            egrep:默认支持的是扩展正则表达式;-G支持基本正则表达式,-F不支持正则表达式
            fgrep:默认不支持正则表达式;-G支持基本正则表达式,-E支持扩展正则表达式
        sed:stream editor,流编辑器,文本编辑工具
        awk:linux上的实现为gawk,文本报告生成器(格式化文本)

正则表达式:Regual Expression,REGEXP
            由一类特殊字符及文本字符所编写的模式,其中有些字符不表示其字面意义,而是用于表示控制或通配的功能
                分两类:
                    基本正则表达式:BRE
                    扩展正则表达式:ERE

元字符:\(hello[[:space:]]\+\)\+

grep:Global search REgular expression and Print out the line
        作用:文本搜索工具,根据用户指定的“模式(过滤条件)”对目标文本逐行进行匹配检查;打印匹配到的行
        模式:由正则表达式的元字符及文本字符所编写出的过滤条件

正则表达式引擎:

grep [OPTIONS] PATTERN [FILE...]
        grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

OPTIONS:
                --color=auto;对匹配到的文本着色后高亮显示
                -i:ignorecase,忽略字符的大小写
                -o:仅显示匹配到的字符串本身
                -v:--invert-match,表示不能够被模式匹配到的行
                -E:支持使用扩展的正则表达式元字符
                -q:--quiet,--silent,静默模式,不输出任何信息

-A #:after,同时显示能被匹配到的行的后#行
                -B #:before,同时显示能被匹配到的行的前#行
                -C #:context,同时显示能被匹配到的行的前后各#行

基本正则表达式的元字符:
                字符匹配:
                    .:匹配任意单个字符
                    []:匹配指定范围内的任意单个字符
                    [^]:匹配指定范围外的任意单个字符
                        [:dight:],[:lower:],[:upper:],[:alpha:],[:alnum:],[:punct:],[:space:]

匹配次数:
                    用在要指定其出现的次数的字符的后面,用于限制其前面字符出现的次数;默认工作于贪婪模式
                    *:匹配其前面的字符任意次:0,1,多次
                        例如:grep "x*y"
                            abxy
                            aby
                            xxxy
                            yab
                    .*:匹配任意长度的任意字符
                    \?:匹配其前面的字符0次或1次,即其前面的字符是可有可无的
                    \+:匹配其前面的字符1次或多次,即其前面的字符要出现至少一次
                    \{m\}:匹配其前面的字符m次,精确匹配
                    \{m,n\}:匹配其前面的字符至少m次,至多n次
                        \{0,n\}:至多n次
                        \{m,\}:至少m次

位置锚定:
                    ^:行首锚定;用于模式的最左侧
                    $:行尾锚定;用于模式的最右侧
                    ^PATTERN$:用于PATTERN来匹配整行
                        ^$:空白行
                        ^[[:space:]]*$:空白行或包含空白字符的行
                    
                    单词:非特殊字符组成的连续字符(字符串)都称为单词
                        \<或\b:词首锚定,用于单词模式的左侧
                        \>或\b:词尾锚定,用于单词模式的右侧
                        \<PATTERN\>:匹配完整单词

分组及引用:                    
                    \(\):将一个或多个字符捆绑在一起,当作一个整体进行处理
                    xy*ab:表示y可以出现任意次
                    \(xy\)*ab:因为bash中括号有特殊意义,所以不能直接用括号,可以用\来把()进行转译

Note:分组括号中的模式匹配到的内容会被正则表达式引擎自动记录于内部的变量中,这些变量为:
                        \1:模式从左侧起,第一个左括号以及与之匹配的右括号之间的模式所匹配到的字符
                        \2:模式从左侧起,第二个左括号以及与之匹配的右括号之间的模式所匹配到的字符
                        \3:
                        ...

建立一个文本:
                            He loves his lover.
                            He likes his lover.
                            She likes her liker.
                            She love her liker.
                        ~]# grep "\(l..e\).*\1" lovers.txt
                    后向引用:引用前面的分组括号中的模式所匹配到的字符

shell脚本基础和grep文本处理工具企业应用3的更多相关文章

  1. shell脚本基础和grep文本处理工具企业应用2

    shell脚本编程:        编程语言的分类:        根据运行方式            编译运行:源代码-->编译器(编译)-->程序文件                优 ...

  2. shell脚本基础和grep文本处理工具企业应用4

    文本处理工具:    egrep:        支持扩展的正则表达式实现类似于grep文本过滤功能:grep -E        egrep [OPTIONS] PATTERN [FILE...]  ...

  3. shell脚本基础和grep文本处理工具企业应用1

      bash特性及bash脚本编程初步: 用户要跟计算机交互就需要有终端,比如:显示器.键鼠等,在终端有附着的接口程序 GUI:KDE.GNome.Xfce CLI:/etc/shells bash ...

  4. shell脚本学习指南-grep文本搜索命令-学习(3)

    1.作用 Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来.grep全称是Global Regular Expression Print,表示全 ...

  5. [linux] grep 文本搜索工具

    grep [option] pattern file Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.grep全称是Global Regular ...

  6. shell脚本-基础

    shell脚本-基础 编程基础 程序是指令+ 数据 程序编程风格: 过程式:以指令为中心,数据服务于指令 对象式:以数据为中心,指令服务于数据 shell 程序提供了编程能力,解释执行. 计算运行二进 ...

  7. Linux shell脚本基础学习详细介绍(完整版)一

    Linux shell脚本基础学习这里我们先来第一讲,介绍shell的语法基础,开头.注释.变量和 环境变量,向大家做一个基础的介绍,虽然不涉及具体东西,但是打好基础是以后学习轻松地前提.1. Lin ...

  8. Shell脚本基础学习

    Shell脚本基础学习 当你在类Unix机器上编程时, 或者参与大型项目如k8s等, 某些框架和软件的安装都是使用shell脚本写的. 学会基本的shell脚本使用, 让你走上人生巅峰, 才怪. 学会 ...

  9. 什么是Shell?Shell脚本基础知识详细介绍

    这篇文章主要介绍了什么是Shell?Shell脚本基础知识介绍,本文是一篇Shell脚本入门文章,在本文你可学到什么是Shell.有多少种Shell.一个Shell脚本代码实例,需要的朋友可以参考下 ...

随机推荐

  1. Django之权限(起步)

    一. 权限概述 1. 认识权限 为什么要有权限? 因为权限让不同的用户拥有不同的功能. 权限可以对功能进行划分. 生活中处处有权限. 比如, 腾讯视频会员才有观看某个最新电影的权限, 你有房间钥匙就有 ...

  2. HTML5元素周期表

    HTML5元素周期表 根元素 1. html 文档根元素 元数据和脚本 1. head HTML文档中的第一个元素.包含文档元数据 2. title 文档标题 3. meta 文档的元数据. meta ...

  3. android#全局获取Context的技巧

    参考<第一行代码>——郭霖 回想这么久以来我们所学的内容,你会发现有很多地方都需要用到Context,弹出Toast的时候需要.启动活动的时候需要.发送广播的时候需要.操作数据库的时候需要 ...

  4. Leetcode之70. Climbing Stairs Easy

    Leetcode 70 Climbing Stairs Easy https://leetcode.com/problems/climbing-stairs/ You are climbing a s ...

  5. 零零散散的shell笔记

    ls __paddlepalm_* > __palminfo__ 名字以__paddlepalm_开头的文件名打印到后面那个info里面 https://www.runoob.com/linux ...

  6. 使用zookeeper作为分布式锁以及设计一种通知监听模式

    1.创建实例/** * 初始化单例的便捷方法 */ public static void init() { getInstance(); } /** * 获取单例 * @return */ publi ...

  7. sql普通语句

    select DISTINCT t_id from nrc_newsDISTINCT不会输出相同的值select top 5 * from nrc_news;检索前五行select * from nr ...

  8. 菜鸟系列Fabric——Fabric 私密数据(6)

    Fabric 私密数据 1.私密数据的定义 如果某个渠道上的一组组织需要将数据与该渠道上的其他组织保密,他们可以选择创建一个仅包含需要访问数据的组织的新渠道.但是,在每种情况下创建单独的通道会产生额外 ...

  9. poco编译与运行

    1.引言 Poco C++库是: 一系列C++类库,类似Java类库,.Net框架,Apple的Cocoa; 侧重于互联网时代的网络应用程序 使用高效的,现代的标准ANSI/ISO C++,并基于ST ...

  10. Arrays.asList()方法注意事项

    1.Arrays.asList()底层数组作为物理层实现.所以返回的List大小不可更改,即不可以做add().remove()操作,并且对List所做的任何变动都会致使原数组发生变动. public ...