java的regex库

java里预留了一个regex库,方便于我们在java里操作正则表达式,或者用它来匹配字符串。

其中比较常用的就是 Pattern 和 Matcher ,pattern是一个编译好的正则表达式,而Mather是一个正则表达式适配器,Mather的功能很强大,所以我们一般用pattern 来获取一个Matcher对象,然后用Matcher来操作正则表达式。先看一下这两个类的用法吧、

Pattern

创建pattern的对象是很简单的,但是由于pattern的构造方法是用private声明的,所以我们仅能通过工厂模式的compile方法来返回一个Pattern的对象。

Pattern pattern = Pattern.compile("[abc]");

compile可以接收一个正则表达式作为参数。

接下来我们创建一个Matcher对象。Matcher的构造方法也是一个private方法,但是我们可以通过Pattern的Matcher方法来返回一个Matcher对象。

Matcher matcher = pattern.matcher("hello abc");

这里matcher可以接收一个字符串作为参数,准确的说这里所接收的参数类型是CharSequences接口类型的参数,但是String、StringBuffer、StringBuilder还有CharBuffer都实现了CharSequence接口,因此我们向里面传入这四种任何我们需要的参数。

与此同时Pattern还提供了一个matches 静态方法,它允许我们传入一个String类型的正则表达式和一个String类型的需要匹配的字符串,并返回一个boolean类型的值,这个方法的好处在于我们可以不用创建pattern对象和matcher对象就可以知道所传入的正则表达式能不能匹配所传入的字符串。

boolean bool = Pattern.matches("\\w+","hello abc");

Watcher

说到Wather,这个东西就很强大了,我们比较常用的方法有:

find();

group();

(1)先来说一下find()和group这两个方法。

find有点像一个迭代器,它能通过正则表达式向前迭代。

下来看一个例子

public class Main {
public static void main(String[] args){
Pattern pattern = Pattern.compile("\\w+");
Matcher matcher = pattern.matcher("hello abc bbc cbc ccc");
//find向前迭代
while(matcher.find()){
System.out.println(matcher.group());
}
}
}

我们先来看看jdk给出的api怎么定义find的;

boolean find();

可以知道find返回的是一个boolean值,当前方没有内容的时候,find会返回false,所以我们这里可以直接用while来写,这句代码打印出的内容是

hello
abc
bbc
cbc
ccc

可以看到其实我们的正则表达式"\\w+"只匹配到了第一个单词hello ,但是因为find迭代的关系,把后面的单词全部都打印出来了,参照的正是我们给出的正则表达式。

(2)group

说到find就不得不说group。

下面看个式子

(a(b)(c(d)))

这里的话我们把整个式子称为第0组,

第一组是 a(b)(c(d))

第二组是 子式 b 和 子式c(d)

第三组是 d

看一下几个group方法

int groupCount()

返回此匹配器模式中的捕获组数

这个方法也就是返回所匹配的字符串的组数。

public class Main {
public static void main(String[] args){
Pattern pattern = Pattern.compile("(\\w+)\\d+");
Matcher matcher = pattern.matcher("hello123 abc bbc cbc ccc");
matcher.find();
System.out.println(matcher.groupCount());
}
}

这里匹配到的是hello123, 当然不加()也能得到,这里只是为了方便演示。

打印出来的数值是1,这是因为我们只有一个组

那group();呢

String group()

返回由以前匹配操作所匹配的输入子序列。

也就是说group是返回所匹配到的第0组的值,返回值是一个String。这也能解释我们刚刚用find进行迭代的那个例子了。

public class Main {
public static void main(String[] args){
Pattern pattern = Pattern.compile("\\w+");
Matcher matcher = pattern.matcher("hello abc bbc cbc ccc");
//find向前迭代
while(matcher.find()){
System.out.println(matcher.group());
}
}
}

这里没有分组所以直接将匹配到的String打印出来,其实也就是第0组.

另外 group还有个重载的方法,可以接收一个int类型的参数

String group(int group)

返回在以前匹配操作期间由给定组捕获的输入子序列。

传入的参数正是组数.

public class Main {
public static void main(String[] args){
Pattern pattern = Pattern.compile("(\\w+)\\s\\d+");
Matcher matcher = pattern.matcher("hello 123 abc bbc cbc ccc");
matcher.find();
System.out.println(matcher.group(1));
}
}

打印出来的结果正在我们的意料之中是hello。

除此之外还有两个可以返回匹配当前字符串的索引的方法。

int start();

int end();

其中start是返回匹配成功的子串的第一个字母的索引,而end是返回子串最后一个索引的位置+1.

String input = "hello abc BBc Cbc ccc";
Matcher matcher = Pattern.compile("[A-Z][A-Z]\\w").matcher(input);
matcher.find();
System.out.println(input.charAt(matcher.start()));

这里打印出来的值是B。但是如果我们换成end就不一样了。

System.out.println(input.charAt(matcher.end()));

这里打印出来的值却是“ ”是一个空字符,也就是c的索引加了1,所以我们这里只需稍作修改便可以打印出c了。

System.out.println(input.charAt(matcher.end()-1));

java的regex库

java里预留了一个regex库,方便于我们在java里操作正则表达式,或者用它来匹配字符串。

其中比较常用的就是 Pattern 和 Matcher ,pattern是一个编译好的正则表达式,而Mather是一个正则表达式适配器,Mather的功能很强大,所以我们一般用pattern 来获取一个Matcher对象,然后用Matcher来操作正则表达式。先看一下这两个类的用法吧、

Pattern

创建pattern的对象是很简单的,但是由于pattern的构造方法是用private声明的,所以我们仅能通过工厂模式的compile方法来返回一个Pattern的对象。

Pattern pattern = Pattern.compile("[abc]");

compile可以接收一个正则表达式作为参数。

接下来我们创建一个Matcher对象。Matcher的构造方法也是一个private方法,但是我们可以通过Pattern的Matcher方法来返回一个Matcher对象。

Matcher matcher = pattern.matcher("hello abc");

这里matcher可以接收一个字符串作为参数,准确的说这里所接收的参数类型是CharSequences接口类型的参数,但是String、StringBuffer、StringBuilder还有CharBuffer都实现了CharSequence接口,因此我们向里面传入这四种任何我们需要的参数。

与此同时Pattern还提供了一个matches 静态方法,它允许我们传入一个String类型的正则表达式和一个String类型的需要匹配的字符串,并返回一个boolean类型的值,这个方法的好处在于我们可以不用创建pattern对象和matcher对象就可以知道所传入的正则表达式能不能匹配所传入的字符串。

boolean bool = Pattern.matches("\\w+","hello abc");

Watcher

说到Wather,这个东西就很强大了,我们比较常用的方法有:

find();

group();

(1)先来说一下find()和group这两个方法。

find有点像一个迭代器,它能通过正则表达式向前迭代。

下来看一个例子

public class Main {
public static void main(String[] args){
Pattern pattern = Pattern.compile("\\w+");
Matcher matcher = pattern.matcher("hello abc bbc cbc ccc");
//find向前迭代
while(matcher.find()){
System.out.println(matcher.group());
}
}
}

我们先来看看jdk给出的api怎么定义find的;

boolean find();

可以知道find返回的是一个boolean值,当前方没有内容的时候,find会返回false,所以我们这里可以直接用while来写,这句代码打印出的内容是

hello
abc
bbc
cbc
ccc

可以看到其实我们的正则表达式"\\w+"只匹配到了第一个单词hello ,但是因为find迭代的关系,把后面的单词全部都打印出来了,参照的正是我们给出的正则表达式。

(2)group

说到find就不得不说group。

下面看个式子

(a(b)(c(d)))

这里的话我们把整个式子称为第0组,

第一组是 a(b)(c(d))

第二组是 子式 b 和 子式c(d)

第三组是 d

看一下几个group方法

int groupCount()

返回此匹配器模式中的捕获组数

这个方法也就是返回所匹配的字符串的组数。

public class Main {
public static void main(String[] args){
Pattern pattern = Pattern.compile("(\\w+)\\d+");
Matcher matcher = pattern.matcher("hello123 abc bbc cbc ccc");
matcher.find();
System.out.println(matcher.groupCount());
}
}

这里匹配到的是hello123, 当然不加()也能得到,这里只是为了方便演示。

打印出来的数值是1,这是因为我们只有一个组

那group();呢

String group()

返回由以前匹配操作所匹配的输入子序列。

也就是说group是返回所匹配到的第0组的值,返回值是一个String。这也能解释我们刚刚用find进行迭代的那个例子了。

public class Main {
public static void main(String[] args){
Pattern pattern = Pattern.compile("\\w+");
Matcher matcher = pattern.matcher("hello abc bbc cbc ccc");
//find向前迭代
while(matcher.find()){
System.out.println(matcher.group());
}
}
}

这里没有分组所以直接将匹配到的String打印出来,其实也就是第0组.

另外 group还有个重载的方法,可以接收一个int类型的参数

String group(int group)

返回在以前匹配操作期间由给定组捕获的输入子序列。

传入的参数正是组数.

public class Main {
public static void main(String[] args){
Pattern pattern = Pattern.compile("(\\w+)\\s\\d+");
Matcher matcher = pattern.matcher("hello 123 abc bbc cbc ccc");
matcher.find();
System.out.println(matcher.group(1));
}
}

打印出来的结果正在我们的意料之中是hello。

除此之外还有两个可以返回匹配当前字符串的索引的方法。

int start();

int end();

其中start是返回匹配成功的子串的第一个字母的索引,而end是返回子串最后一个索引的位置+1.

String input = "hello abc BBc Cbc ccc";
Matcher matcher = Pattern.compile("[A-Z][A-Z]\\w").matcher(input);
matcher.find();
System.out.println(input.charAt(matcher.start()));

这里打印出来的值是B。但是如果我们换成end就不一样了。

System.out.println(input.charAt(matcher.end()));

这里打印出来的值却是“ ”是一个空字符,也就是c的索引加了1,所以我们这里只需稍作修改便可以打印出c了。

System.out.println(input.charAt(matcher.end()-1));

matcher 和 lookingAt

这两个方法都返回一个boolean值,不同的是matcher是将整个输入序列拿去匹配,而lookingAt一旦匹配成功一个子串就返回true。

public class Main {
public static void main(String[] args){
String s="aaaaaaaaaabbbbbbbbb";
Matcher matcher = Pattern.compile("a+").matcher(s);
System.out.println(matcher.lookingAt());//true
}
}

这里匹配到的是aaaaaaaaaaa,因为用的是lookingAt,所以直接返回true了

如果换做是matches()。

System.out.println(matcher.matches());//false

即返回false

java 如何用pattern 和 Matcher 来使用正则表达式的更多相关文章

  1. java 如何用pattern 和 Matcher 来使用正则表达式(一)

    近期用到了java或者scala的正则表达式的用法,抽点时间总结一下: 转自:https://www.cnblogs.com/haodawang/p/5967219.html java的regex库 ...

  2. java.util.regex.Pattern正则表达式写验证器示例

    import java.util.regex.Pattern; /** * 校验器:利用正则表达式校验邮箱.手机号等 * */ public class Validator { /** * 正则表达式 ...

  3. JAVA 正则 Pattern 和 Matcher

    java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 1.简介:  java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. ...

  4. java正则表达式Pattern和Matcher

    java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 1.简介:  java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. ...

  5. Java基础知识强化77:正则表达式之获取功能(Pattern 和 Matcher类的使用)

    1. 获取功能: Pattern 和 Matcher类结合使用 2. 使用案例: package cn.itcast_05; import java.util.regex.Matcher; impor ...

  6. java Pattern和Matcher详解

    结论:Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持. 单独用Pattern只能使用Pattern.matcher(String ...

  7. 【java】java.util.regex.Pattern和java.util.regex.Matcher简单示例

    package 正则; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Test_regex ...

  8. JAVA正则表达式 Pattern和Matcher

    java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 1.简介:  java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. ...

  9. 关于java中Pattern和Matcher区别于联系

    本文章转自: http://blog.csdn.net/cclovett/article/details/12448843 结论:Pattern与Matcher一起合作.Matcher类提供了对正则表 ...

随机推荐

  1. JavaScript之HTML5 data-* 自定义属性[HTML5标准 node.dataset.attributeName]

    在HTML5中添加了data-*的方式来自定义属性,所谓data-*实际上上就是data-前缀加上自定义的属性名,使用这样的结构可以进行数据存放. 使用data-*可以解决自定义属性混乱无管理的现状. ...

  2. luogu P1084 疫情控制

    传送门 首先,所有军队又要尽量往上走,这样才能尽可能的封锁更多的到叶子的路径 而随着时间的增加,能封锁的路径也就越来越多,所以可以二分最终的时间 然后对于每个时间,就让能走到根的军队走到根,记录到根上 ...

  3. CF115B Lawnmower(贪心)

    CF115B Lawnmower \(solution:\) 很明显的一道贪心题,奇数行只能向左走,偶数行只能向右走,每一行的起点应该在上一行就已确定,而这一行的终点只和(这一行最后一棵草(相对于你走 ...

  4. transform 图标旋转,IE8、IE7不兼容

    要将图标旋转,只需使用transform的rotate以及transition即可完成旋转的动画效果.ease 规定慢速开始,然后变快,然后慢速结束的过渡效果;   ease-in 规定以慢速开始的过 ...

  5. 教你如何使用android studio发布release 版本【转】

    原文链接 想必还有人对如何在Android studio (以下简称as)发布release版本的app而狂刷百度吧?都是过来人,我很理解这种心情,百度到的基本是半成品,为什么这么说呢?百度一下,你就 ...

  6. 【转】linux的特殊符号与正则表达式

    [转]linux的特殊符号与正则表达式 第1章 linux的特殊符号 1.1 通配符 * {} 1.1.1 含义 方便查找文件 通配符是用来找文件名字的. 1.1.2  * 通过find 命令找以 . ...

  7. 【转】Python之日期与时间处理模块(date和datetime)

    [转]Python之日期与时间处理模块(date和datetime) 本节内容 前言 相关术语的解释 时间的表现形式 time模块 datetime模块 时间格式码 总结 前言 在开发工作中,我们经常 ...

  8. git获取内核源码的方法

    [转]http://www.360doc.com/content/17/0410/16/23107068_644444795.shtml 1. 前言 本文主要讲述ubuntu下通过git下载linux ...

  9. UML和模式应用5:细化阶段(1)--第1次迭代

    1.前言 从本文开始进入细化阶段,讨论迭代技术的基础,本次讨论将着重讨论第一次迭代,以POS机为例. 2. 第一次迭代处理的需求(以NextGen POS项目处理销售用例) 实现 处理销售 用例中基本 ...

  10. jvm系列二、JVM内存结构

    原文链接:http://www.cnblogs.com/ityouknow/p/5610232.html 所有的Java开发人员可能会遇到这样的困惑?我该为堆内存设置多大空间呢?OutOfMemory ...