java.util.regex包下的Pattern类和Matcher类的使用总结
一.介绍
Java正则表达式通过java.util.regex包下的Pattern类与Matcher类实现
1.Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,但可以通过Pattern.complie(String regex)简单工厂方法创建一个正则表达式.
2.Matcher类的构造方法也是私有的,不能随意创建,只能通过Pattern.matcher(CharSequence input)方法得到该类的实例.Pattern类只能做一些简单的匹配操作,
要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持.
二.Pattern类
1.Pattern.compile(),Pattern.pattern()
Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,但可以通过Pattern.complie(String regex)简单工厂方法创建一个正则表达式,将给定的正则表达式编译到模式中.
pattern() 返回正则表达式的字符串形式,其实就是返回Pattern.complile(String regex)的regex参数
/**
* Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,
* 但可以通过Pattern.complie(String regex)简单工厂方法创建一个正则表达式,将给定的正则表达式编译到模式中,
* pattern() 返回正则表达式的字符串形式,其实就是返回Pattern.complile(String regex)的regex参数
*/
@Test
public void test3(){
Pattern p=Pattern.compile("\\w+");
String str = p.pattern();
System.out.println(str);//返回 \w+
}
2.Pattern.split()
Pattern有一个split(CharSequence input)方法,用于分隔字符串,并返回一个String[],String.split(String regex)就是通过Pattern.split(CharSequence input)来实现的.
/**
* Pattern有一个split(CharSequence input)方法,用于分隔字符串,并返回一个String[],
* String.split(String regex)就是通过Pattern.split(CharSequence input)来实现的.
*/
@Test
public void test4(){
Pattern p=Pattern.compile("\\d+");
String[] str=p.split("我的QQ是:456456我的电话是:0532214我的邮箱是:aaa@aaa.com");
for (String string : str) {
System.out.println(string);
/*
打印结果:
我的QQ是:
我的电话是:
我的邮箱是:aaa@aaa.com
*/
}
}
3.Pattern.matches()
Pattern.matches(String regex,CharSequence input)是一个静态方法,用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串.
@Test
public void test5(){
System.out.println(Pattern.matches("\\d+","2223"));//返回true
System.out.println(Pattern.matches("\\d+","2223aa"));//返回false,需要匹配到所有字符串才能返回true,这里aa不能匹配到
System.out.println(Pattern.matches("\\d+","22bb23"));//返回false,需要匹配到所有字符串才能返回true,这里bb不能匹配到
}
三.Matcher类
Matcher类的构造方法也是私有的,不能随意创建,只能通过Pattern.matcher(CharSequence input)方法得到该类的实例.Pattern类只能做一些简单的匹配操作,要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作.
Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持.
1.Pattern.matcher()
@Test
public void test6(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("22bb23");
m.pattern();//返回p 也就是返回该Matcher对象是由哪个Pattern对象的创建的
}
2.Matcher.matches()
Matcher类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false,matches()对整个字符串进行匹配,只有整个字符串都匹配了才返回true
/**
* Matcher类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false
* matches()对整个字符串进行匹配,只有整个字符串都匹配了才返回true
*/
@Test
public void test7(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("22bb23");
System.out.println( m.matches() );//返回false,因为bb不能被\d+匹配,导致整个字符串匹配未成功. Matcher m2=p.matcher("2223");
System.out.println( m2.matches() );//返回true,因为\d+匹配到了整个字符串
}
我们现在回头看一下Pattern.matches(String regex,CharSequence input),它与Pattern.compile(regex).matcher(input).matches() 等价!
3.Matcher.lookingAt()
lookingAt()对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true
/**
* lookingAt()对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true
*/
@Test
public void test8(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("22bb23");
System.out.println( m.lookingAt() );//返回true,因为\d+匹配到了前面的22 Matcher m2=p.matcher("aa2223");
System.out.println( m2.lookingAt() );//返回false,因为\d+不能匹配前面的aa
}
4.Matcher.find()
find()对字符串进行匹配,匹配到的字符串可以在任何位置.
/**
* find()对字符串进行匹配,匹配到的字符串可以在任何位置.
*/
@Test
public void test9(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("22bb23");
System.out.println( m.find() );//返回true Matcher m2=p.matcher("aa2223");
System.out.println( m2.find() );//返回true Matcher m3=p.matcher("aa2223bb");
System.out.println( m3.find() );//返回true Matcher m4=p.matcher("aabb");
System.out.println( m4.find() );//返回false
}
5.Matcher.start(),Matcher.end(),Matcher.group()
@Test
public void test10(){
Pattern p=Pattern.compile("\\d+");
Matcher matcher = p.matcher("aaa2223bb");
System.out.println( matcher.find() );//返回ture 匹配2223
System.out.println( matcher.start() );//返回3
System.out.println( matcher.end() );//返回7,返回的是2223后的索引号
System.out.println( matcher.group() ); //返回2223
System.out.println("============="); Matcher matcher2=p.matcher("2223bb");
System.out.println( matcher2.lookingAt() ); //返回true 匹配2223
System.out.println( matcher2.start() ); //返回0,由于lookingAt()只能匹配前面的字符串,所以当使用lookingAt()匹配时,start()方法总是返回0
System.out.println( matcher2.end() ); //返回4
System.out.println( matcher2.group() ); //返回2223
}
6.Matcher.start(i),Matcher.end(i),Matcher.group(i)
start(),end(),group()均有一个重载方法它们是start(int i),end(int i),group(int i)专用于分组操作,Mathcer类还有一个groupCount()用于返回有多少组.
/**
*说了这么多,相信大家都明白了以上几个方法的使用,该说说正则表达式的分组在java中是怎么使用的.
*start(),end(),group()均有一个重载方法它们是start(int i),end(int i),group(int i)专用于分组操作,Mathcer类还有一个groupCount()用于返回有多少组.
*/ @Test
public void test11(){
Pattern p=Pattern.compile("([a-z]+)(\\d+)");
Matcher m=p.matcher("aaa2223bb");
m.find(); //匹配aaa2223
m.groupCount(); //返回2,因为有2组
m.start(1); //返回0 返回第一组匹配到的子字符串在字符串中的索引号
m.start(2); //返回3
m.end(1); //返回3 返回第一组匹配到的子字符串的最后一个字符在字符串中的索引位置.
m.end(2); //返回7
m.group(1); //返回aaa,返回第一组匹配到的子字符串
m.group(2); //返回2223,返回第二组匹配到的子字符串
}
四.较高级的正则匹配操作 (主要是Matcher.group() 的使用)
1.
/**
* 现在我们使用一下稍微高级点的正则匹配操作,例如有一段文本,里面有很多数字,
* 而且这些数字是分开的,我们现在要将文本中所有数字都取出来,利用java的正则操作是那么的简单.
*/
@Test
public void test12(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("我的QQ是:456456 我的电话是:0532214 我的邮箱是:aaa123@aaa.com");
while(m.find()) {
System.out.println(m.group());
/*
打印输出
456456
0532214
123
*/
}
}
2.
/**
* 现在大家应该知道,每次执行匹配操作后start(),end(),group()三个方法的值都会改变,
* 改变成匹配到的子字符串的信息,以及它们的重载方法,也会改变成相应的信息.
* 注意:只有当匹配操作成功,才可以使用start(),end(),group()三个方法,否则会抛出java.lang.IllegalStateException,
* 也就是当matches(),lookingAt(),find()其中任意一个方法返回true时,才可以使用.
*/
@Test
public void test13(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("我的QQ是:456456 我的电话是:0532214 我的邮箱是:aaa123@aaa.com");
while(m.find()) {
System.out.println(m.group());
System.out.print("start:"+m.start());
System.out.println(" end:"+m.end());
/*
打印输出
456456
start:6 end:12
0532214
start:19 end:26
123
start:36 end:39
*/
}
}
3.见另一篇博客http://www.cnblogs.com/DreamDrive/p/7594259.html
@Test
public void test1() {
Pattern pattern = Pattern.compile("页面下载失败\\.url:\\[http://[a-z0-9]+\\.(.+)/.+\\]\\.当前时间戳:\\[([0-9]+)\\]");
Matcher matcher = pattern.matcher("页面下载失败.url:[http://item.jd.com/15626278.html].当前时间戳:[1471415298943]");
if(matcher.find()){
String top_domain = matcher.group(1);
String curr_time = matcher.group(2);
System.out.println(top_domain+"--"+"--"+curr_time);//jd.com----1471415298943
}
} @Test
public void test2(){
String url = "https://item.jd.com/698763154.html";
Pattern pattern = Pattern.compile("https://item.jd.com/([0-9]+).html");
Matcher matcher = pattern.matcher(url);
if(matcher.find()){
System.out.println(matcher.group(1));//
System.out.println(matcher.group(0));//https://item.jd.com/698763154.html
}
}
java.util.regex包下的Pattern类和Matcher类的使用总结的更多相关文章
- java.util.regex包下的Pattern和Matcher详解(正则匹配)
		
java正则表达式通过java.util.regex包下的Pattern类与Matcher类实现(建议在阅读本文时,打开java API文档,当介绍到哪个方法时,查看java API中的方法说明,效果 ...
 - java.util.concurrent包下集合类的特点与适用场景
		
java.util.concurrent包,此包下的集合都不允许添加null元素 序号 接口 类 特性 适用场景 1 Queue.Collection ArrayBlockingQueue 有界.阻塞 ...
 - Function接口 – Java8中java.util.function包下的函数式接口
		
Introduction to Functional Interfaces – A concept recreated in Java 8 Any java developer around the ...
 - Java并发编程之java.util.concurrent包下常见类的使用
		
一,Condition 一个场景,两个线程数数,同时启动两个线程,线程A数1.2.3,然后线程B数4.5.6,最后线程A数7.8.9,程序结束,这涉及到线程之间的通信. public class Co ...
 - Java中java.util.concurrent包下的4中线程池代码示例
		
先来看下ThreadPool的类结构 其中红色框住的是常用的接口和类(图片来自:https://blog.csdn.net/panweiwei1994/article/details/78617117 ...
 - java.util.concurrent包下并发锁的特点与适用场景
		
序号 类 备注 核心代码 适用场景 1 synchronized 同步锁 并发锁加在方法级别上,如果是单例class对象,则只能允许一个线程进入public synchronized void doX ...
 - JAVA正则表达式:Pattern类与Matcher类详解(转)
		
java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表 ...
 - JAVA正则表达式:Pattern类与Matcher类详解
		
java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表 ...
 - Java正则表达式:Pattern类和Matcher类
		
一.捕获组的概念 捕获组可以通过从左到右计算其开括号来编号,编号是从1 开始的.例如,在表达式 ((A)(B(C)))中,存在四个这样的组: 1 ((A)(B(C))) 2 (A) 3 ...
 
随机推荐
- mysql伪列
			
<!-- NOTE:internal_name_trim使用的是伪列,而不是数据库返回的数据 --><select id="listByStoreIdAndPartsN ...
 - [C#.net]SQL参数传入空值报错解决方案
			
C#中的null与SQL中的NULL是不一样的,SQL中的NULL用C#表示出来就是DBNull.Value. 注意:SQL参数是不能接受C#的null值的,传入null就会报错. SqlComman ...
 - 【Selenium】【BugList11】启动selenium server报错:Unsupported major.minor version 52.0
			
[环境信息] python:3.6.5 平台:win7 selenium:3.11.0 selenium server:selenium-server-standalone-3.11.0.jar jd ...
 - Codeforces 873 简要题解
			
文章目录 A题 B题 C题 D题 E题 F题 传送门 A题 传送门 题意: 一个人要做nnn件事,时间花费分别为a1,a2,...,an,a1≤a2≤a3≤...≤ana_1,a_2,...,a_n, ...
 - opencv2.4.13+python2.7学习笔记--opencv中的Gui特性--图片:读图像,显示图像,保存图像
			
阅读对象:可以配置opencv+Python环境的任何人,毕竟写这篇文章的人就是小白. 1.环境说明 1.1opencv版本: 1.2Python版本: 1.3系统:win7 注: (1)opencv ...
 - IO模型的介绍
			
Stevens 在文章中的一种IO Model: ****blocking IO #阻塞 IO (系统调用不返回结果并让当前线程一直阻塞,只有当该系统调用获得结果或者超时出错才返回) *** ...
 - linux dhcp 简单配置
			
dhcp 端口 UDP67和UDP68为正常的DHCP服务端口 rpm -qa | grep dhcp 查询是否安装了dhcp 服务 安装dhcp 服务 yum install dhcp -y 打开/ ...
 - 手把手教你利用Python自动下载CL社区图片
			
需求描述: 最近发现CL社区上好多精华的帖子分享的图片非常棒,好想好想保存下来,但是一张一张地保存太费时间了,因此,造物者思想主义的我就想动手写个工具,实现只要输入帖子的链接,就能把所有的精华 ...
 - 02 of learning python
			
01 input输入的是str类型 如果输入的是数字的话,要记得强制转换一下! 02 isdigit() 这个方法是用来检测字符串是否全部由数字组成 str.isdigit() 如果字符串只包含数字则 ...
 - 记一个centos分区大小调整过程
			
1. 备份 /home 目录 [root@centos ~]# cp -r /home /home_backup 2. 查看目前磁盘使用的情况, 需要将 /dev/mapper/centos-home ...