提升正则读写效率,超好用的正则图解工具Regulex与在线调试工具regexr

壹 ❀ 引
正则表达式可以说是不少开发者心中的一根刺,平时使用场景好像也不多,但一旦要用写起来又有些头疼。抱着长痛不如短痛的想法,我曾在2019年年末,花了半个月时间完整读完了老姚的正则迷你书,并在博客中记录了对应章节的读书笔记。虽然正则没到多厉害的地步,但起码也满足了日常开发中正则的读与写。
碰巧今天前同事问了我一个非捕获括号?:的问题,表示看了文档解释但还是不理解使用场景,不明白其中含义,我也花了一些时间给他写demo解释正则分组,反向引用与非捕获括号的使用场景。在沟通的过程中,我发现其实很多正则我通过工具看一目了然,但他单看正则的代码有一堆疑惑,我解释起来也比较费劲....

而正则觉得难无非难在两点,看不懂(长正则易读性都很差)与不会写(不敢保证写的对),针对这两点我给他分享了两个工具,一个专门用于看,一个专门用于在线写在线测,所以这里专门做个分享,若有缘人对于正则也感兴趣,希望也能对你有所帮助。
壹 ❀ 正则图解神器Regulex
Regulex这个工具也是我在阅读正则迷你书时,作者所推荐的一个工具。长正则因为分组多正则表达式长,我们单看代码可能从到到哪是一个组都看的费劲,但通过图解工具,你的分组,每个分组起到什么作用都非常清晰。
比如我们现在要实现一个正则,匹配任意三个连续且完全相同的数字,比如:
const regex = /^(\d)\1{2}$/g;
regex.test(123);// false
regex.test(111);// true
regex.test(555);// true
/^(\d)\1{2}$/g是一个结构相对简单的正则,(前提得建立了分组与反向引用的概念),但对于了解基本概念但读正则有点费劲的同学,心里肯定会想,这是个啥玩意?我们将这段正则复制到Regulex中,图解图下:

Group #1 代表分组1,对应正则也就是(\d)这一段,而Digit也解释了含义,表示匹配一个任意数字。
Backref 表示反向引用,引用谁?紧接着一个#1表示反向引用分组1,而Backref #1被一个2 times连通,代表这一段匹配2次。
那么总结来说,(\d)匹配一个任意精确的数字,反向引用再匹配这个数字两次,加起来就是一个数字重复匹配3次,所以这也是为什么123匹配失败,因为当匹配到1时,\1{2}此时已经被确定成再反向引用匹配 1 两次了。我在正则某篇博客中也回答过一位读者对于反向引用的疑问,当时也说/^(\d)\1{2}$/g不能理解成/^(\d)(\d)(\d)$/g的原因,后者表示匹配任意三个数,而反向引用的作用是在分组成功匹配后,再决定重复去匹配相同的什么数字,当然扯得有点远了,总而言之非常好用的一个图解工具,在面对非常长的正则,详细的分组以及注解也能更好的帮你理解一个正则。
贰 ❀ 正则在线调试工具regexr
如果说Regulex主要用来帮助我们读,那么regexr能非常方便的帮助我们在线写正则,比如在日常开发中我们写了一个正则,看上去似乎满足了需求,又担心它会不会出乎意料的匹配到我们不想要的内容,regexr就能起到一个很好的测试作用。
regexr界面非常简单,一共分为三个区域,上方Expression用来写你的正则,下方Text用于写你的测试用例,而最下方的工具栏Tools能让你写一个正则做更多事。

比如在上图中,我定义了一个正则/\d([a-z]+)/,以及一个例子123abc12,于是被匹配的区域成功高亮;在更下方工具栏,我们选择了Replace,我们希望将匹配内容替换成 ❀ ,于是在下面我们看到了替换完成的结果 12❀12。
你完全可以将一个正则写好贴上去,然后把很多个正则匹配边界情况的例子统统加入到Text中,用于检验你的正则是否符合你的预期。而在Expression右侧,我们还能切换变成语言,以及选用更多修饰符,比如是否启用全局匹配,是否多行,是否区分大小写等等。
我在给前同事解释分组与反向引用的过程中,他问了我一个这个问题,为什么下面这段代码输出是true:
new RegExp(/(?:[0-9]){1}-([a-z])\1{3}/).test('111111-bbbb')// true
对于他而言,他的理解是(?:[0-9]){1}这一段明明限定了只匹配1个任意数字,那为什么后面用例这么多个1还匹配成功了,单看这代代码,好像真是这么回事,但只要你把这个正则贴到regexr中你完全不会有这个疑虑:

因为这个正则并没有限定从什么地方开始匹配数字1,他给的这个例子中确实有一小段符合要求,当然返回是true。若想达到他的预期,只需要在正则前加一个^即可。
new RegExp(/^(?:[0-9]){1}-([a-z])\1{3}/).test('111111-bbbb')// false
一个更直观的匹配效果,确实比单纯看是否匹配成功要来的更为清晰,当然,本工具只是站在更快捷帮你写需要的正则,前提还是需要大家掌握正则基本概念,这两个工具才会体现出应有的价值。

我在回顾之前所写的正则博客,发现最后一篇的时间是19年的12月28,而今天恰好也是12月28,不知不觉时间竟过去了三年,心中难免有少许感慨,新年的最后几天继续加油,晚安。
提升正则读写效率,超好用的正则图解工具Regulex与在线调试工具regexr的更多相关文章
- fir.im Weekly - 17 个提升 iOS 开发效率的必备工具
本期 fir.im Weekly 精选了一些iOS 开发工具和动画源码分享,希望每个开发者能专注效率.实用.灵感. iOS开发工具--如何优化ipa包大小 @iOS程序犭袁 推荐了关于"如 ...
- Atitit. 提升软件开发效率and 开发质量---java 实现dsl 4gl 的本质and 精髓 O725
Atitit. 提升软件开发效率and 开发质量---java 实现dsl 4gl 的本质and 精髓 O725 1. DSL主要分为三类:外部DSL.内部DSL,以及语言工作台. 1 2. DSL ...
- atitit.提升软件开发效率大的总结O5
atitit.提升软件开发效率大的总结O5 #---平台化.组件化 1 #--cbb公用模块的建设 1 #---内部最佳流程方法跟实践的总结 2 #---内部知识体系的建设 2 #---问题Qa库的建 ...
- C&python文件读写效率
不同缓冲区读写文件的效率比较 环境:CentOS6.3/ext3/ 读取文件大小:100000000B BUFSIZE TIMECOST 1 real 0m38.909s user 0m5.960s ...
- js jquery版本的 金额千分位转换函数(非正则,效率极高)
没想到js里面没有 金额千分位格式化的处理函数(例:1,234.01 这样的格式),网上搜了一圈,都是使用正则的方式处理的.正则的效率不敢恭维啊,又耗费资源速度又慢(虽然处理起来会直观一些). 因此专 ...
- 使用Charles Proxy提升iOS开发效率
以前做前端开发的时候,使用最多的工具就是 Fiddler ,用来定位问题.模拟特定场景非常方便,极大提升了开发效率.而转做 iOS 开发以后,一大头疼的问题是 Fiddler 没有 Mac 版,幸亏找 ...
- 自定义Spark Partitioner提升es-hadoop Bulk效率
http://www.jianshu.com/p/cccc56e39429/comments/2022782 和 https://github.com/elastic/elasticsearch-ha ...
- python爬虫---scrapy框架爬取图片,scrapy手动发送请求,发送post请求,提升爬取效率,请求传参(meta),五大核心组件,中间件
# settings 配置 UA USER_AGENT = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, l ...
- 【老孟Flutter】6种极大提升Flutter开发效率的工具包
老孟导读:本文介绍6种极大提升Flutter开发效率的工具包. [1] 强大的日志软件包 在开发 Flutter 的过程中打印日志是常用的调试方式之一,但 Flutter 内置的日志打印非常简单,下面 ...
- 性能基准DevOps之如何提升脚本执行效率
1.宝路说 宝路最近一直在自我思考:性能基准DevOps工作已经开展一段时间了,目前我们确实已经取得了一些成果,显然这还远远不够.趁闲暇之余跟组员进行了简单的头脑风暴!于是这就有了今天的主题,当然这仅 ...
随机推荐
- python代码打包exe程序
1.安装pyinstaller 命令行输入:pip install pyinstaller 2.打包exe程序 输入命令:pyinstaller -F -w *.py(星号是.py的全部路径) pyi ...
- python中BeautifulSoup库使用小结
转载请注明出处: BeautifulSoup是一个用于解析HTML和XML文档的Python库,它提供了一些简单但强大的API,让你可以从文档中提取数据.以下是一些BeautifulSoup的主要特性 ...
- C语言中的操作符:了解与实践
欢迎大家来到贝蒂大讲堂 养成好习惯,先赞后看哦~ 所属专栏:C语言学习 贝蒂的主页:Betty's blog 1. 操作符的分类 操作符又叫运算符,它在C语言中起着非常大的作用,以下是 ...
- [转帖].NET Framework 中的传输层安全性 (TLS) 最佳做法
https://learn.microsoft.com/zh-cn/dotnet/framework/network-programming/tls 传输层安全性 (TLS) 协议是一个行业标准,旨在 ...
- [转帖]Oracle的审计
AUDIT_TRAIL 初始化参数AUDIT_TRAIL用于控制数据库审计,默认值为none. 参数类型: String 默认值: none 允许动态修改: 否 基本参数: 否 语法: AUDIT_T ...
- [转帖]3.3.8. KWR运行期对比报告 KWR DIFF
https://help.kingbase.com.cn/v8/perfor/performance-optimization/performance-optimization-6.html#sys- ...
- [转帖]金仓数据库KingbaseES V8R6 索引膨胀
索引膨胀 对于索引,随着业务不断的增删改,会造成膨胀,尤其Btree索引,也会涉及索引分裂.合并等,导致索引访问效率降低.维护成本增加.另外,索引页的复用与HEAP PAGE不一样,因为索引的内容是有 ...
- [转帖]Redis各版本特性汇总
redis4 redis5 redis6 redis6.2 重大特性 1.模块系统 2.PSYNC2 3.LFU淘汰策略 4.混合RDB-AOF持久化 5.LAZY FREE延迟释放 6.MEMORY ...
- [转帖]如何通过shell脚本对一个文件中的所有数值相加并求和
https://developer.aliyun.com/article/886170?spm=a2c6h.24874632.expert-profile.255.7c46cfe9h5DxWK 1.背 ...
- [转帖] mysql的timestamp会存在时区问题?
我感觉 这样理解也有点不对 timestamp 应该是不带时区 只是 UTC1970-1-1 的时间戳 但是展示时会根据时区做一下计算 date time 就不会做转换而已. 原创:打码日记(微信 ...