转自:http://www.itzhai.com/java-notes-regex-matches-and-lookingat.html#read-more

     2.1.1、split方法
   3.2、Group

本文主要内容:
  1. 正则表达式最基本的语法;
  2. String内建的正则表达式功能,常用方法:split(), replaceFirst(), replaceAll();
  3. 使用Java创建正则表达式,相关类:Pattern, Matcher, Group;
  4. Pattern标记的介绍,使用Pattern.complie(String regex, int flag)给正则表达式指定模式;
  5. Pattern中的split方法,与String中的split类似;
  6. Matcher的替换操作,常用方法:replaceAll(String replacement), replaceFirst(String replacement), appendReplacement(StringBuffer sb, String replacement) , appendTail(StringBuffer sb);
  7. Matcher中reset()方法的使用;
  8. 在JAVA I/O中使用正则表达式。

  很久以前,正则表达式就整合到了Unix工具集中,例如sed和awk,也整合到了Python和Perl之类的程序设计语言中。Java中的字符串操作还主要集中在String,StringBuffer和StringTokenizer类,提供的功能相比于正则表达式简单有限。

1、基本语法:

关于Java中的正则表达式详细的语法,可以参考JDK文档。

\\  在其他语言中\\表示在正则表达式中插入一个普通的反斜线,而Java中则表示插入正则表达式的反斜线,所以其后的字符具有特殊的意义。
\\d  表示一位数字
\\\\  表示普通的反斜线
\n\t  表示换行和制表符,只需要使用单反斜线
-?\\d+  表示可能有一个负号,后面跟着一位或多位数字
 
2、String内建的正则表达式功能:

String str ="-123";
boolean isNum = str.matches("(-|\\+)?\\d+");// 可能包含负号或者正号的整数
System.out.println(isNum);// output: true
2.1、String类自带的正则表达式工具:
  2.1.1、split方法:

    这是String中提供的一个非常有用的正则表达式工具,作用是将字符串从正则表达式匹配的地方分开。

// split方法演示
String content ="Hello, this is an iPad.";
String[] items = content.split("\\W+");// 使用非单词字符分割字符串
System.out.println(Arrays.toString(items));
// [Hello, this, is, an, iPad] 可以发现逗号也被当做分隔符给去掉了
// split方法的重载版本,允许你限制字符串分割的次数
items = content.split("\\W+",3);
System.out.println(Arrays.toString(items));
// [Hello, this, is an iPad.]
  2.1.2、字符串替换之replaceFirst和replaceAll方法:

// 字符串的替换  replaceFirst和replaceAll方法
String str ="You make me cry, make me smile.";
System.out.println(str.replaceFirst("m\\w+","music"));// You music me cry, make me smile.
System.out.println(str.replaceAll("make|me","music"));// You music music cry, music music smile.
3、创建正则表达式:
  3.1、Pattern和Matcher:

    为了更加方便的使用正则表达式,强烈建议多去浏览JDK文档中java.util.regex.Pattern那一页的内容。

    下面是一个用Java创建正则表达式的例子:

String content ="one step tototoo far.";
// 编译正则表达式生成一个Pattern对象
Pattern p =Pattern.compile("(to){2,}");
// 用Pattern对象的matcher()方法检索字符串,生成Matcher对象
Matcher m = p.matcher(content);while(m.find()){
  System.out.println("Match \""+ m.group()+"\" ad position "+ m.start()+"-"+(m.end()-1));// output: Match "tototo" ad position 9-14
}

    使用Matcher上的各种方法,可以判断各种不同类型的匹配是否成功:

    boolean matches(): 

      尝试将整个区域与模式匹配。

      如果匹配成功,则可以通过 start、end 和 group 方法获取更多信息。

      返回:

      当且仅当整个区域序列匹配此匹配器的模式时才返回 true。

    boolean lookingAt(): 

    尝试将从区域开头开始的输入序列与该模式匹配。

    与 matches 方法类似,此方法始终从区域的开头开始;与之不同的是,它不需要匹配整个区域。

    如果匹配成功,则可以通过 start、end 和 group 方法获取更多信息。

    返回:

    当且仅当输入序列的前缀匹配此匹配器的模式时才返回 true。

    boolean find(): 

尝试查找与该模式匹配的输入序列的下一个子序列。

此方法从匹配器区域的开头开始,如果该方法的前一次调用成功了并且从那时开始匹配器没有被重置,则从以前匹配操作没有匹配的第一个字符开始。

如果匹配成功,则可以通过 start、end 和 group 方法获取更多信息。

返回:

当且仅当输入序列的子序列匹配此匹配器的模式时才返回 true。

boolean find(int start): 

重置此匹配器,然后尝试查找匹配该模式、从指定索引开始的输入序列的下一个子序列。

如果匹配成功,则可通过 start、end 和 group 方法获取更多信息,而 find() 方法的后续调用将从此匹配操作未匹配的第一个字符开始。

返回:

当且仅当从给定索引开始的输入序列的子序列匹配此匹配器的模式时才返回 true。

抛出:

IndexOutOfBoundsException- 如果开始点小于零或大于输入序列的长度。

下面是一个使用 boolean find(int start)的例子:

// boolean find(int start)
String content ="wings you are the hero~";
Pattern p =Pattern.compile("\\w+");
Matcher m = p.matcher(content);
int i=0;
while(m.find(i)){
  System.out.print(m.group()+" ");
i++;
}

输出内容为:

wings ings ngs gs s you you ou u are are re e the the he e hero hero ero ro o
  
  .
  . 
  . 请查看原文章
  .
  .
 
3.5、替换操作:

  主要看到Matcher的以下几个方法:

replaceAll

public String replaceAll(String replacement)
替换模式与给定替换字符串相匹配的输入序列的每个子序列。 

replaceFirst

public String replaceFirst(String replacement)
替换模式与给定替换字符串匹配的输入序列的第一个子序列。 

appendReplacement

public Matcher appendReplacement(StringBuffer sb,
String replacement)
实现非终端添加和替换步骤。此方法执行以下操作:

  1. 它从添加位置开始在输入序列读取字符,并将其添加到给定字符串缓冲区。在读取以前匹配之前的最后字符(即位于索引 start() - 1 处的字符)之后,它就会停止。
  2. 它将给定替换字符串添加到字符串缓冲区。
  3. 它将此匹配器的添加位置设置为最后匹配位置的索引加 1,即 end()

appendTail

public StringBuffer appendTail(StringBuffer sb)
实现终端添加和替换步骤。此方法从添加位置开始从输入序列读取字符,并将其添加到给定字符串缓冲区。可以在一次或多次调用 appendReplacement 方法后调用它来复制剩余的输入序列。

下面通过一个程序来演示一下这几个方法的使用,并且通过这个程序,更加熟悉正则表达式的使用:

String content = "/*! long   long  ago, the is a man called Jack, \n" +
" he has one boat. !*/";
// Pattern.DOTALL: 这种模式下 . 可以匹配任何字符,包括换行符
Pattern p = Pattern.compile("/\\*!(.*)!\\*/", Pattern.DOTALL);
Matcher m = p.matcher(content);
if(m.find())
// 匹配到/*! !*/中的内容
content = m.group(1);
// 把两个以上空格的地方缩减为一个空格
content = content.replaceAll(" {2,}", " ");
// 开启多行模式,删除每一行开头部分的空格,+表示匹配一个或多个
content = content.replaceAll("(?m)^ +", "");
// 匹配到字符串中的第一个元音字母,并替换为VOWEL
content = content.replaceFirst("[aeiou]", "VOWEL");
// 下面一段程序演示把字符串中的所有元音字母替换为大写
Pattern p1 = Pattern.compile("[aeiou]");
Matcher m1 = p1.matcher(content);
StringBuffer sb = new StringBuffer();
while(m1.find()){
// 非终端添加和替换,
m1.appendReplacement(sb, m1.group().toUpperCase());
}
// 终端添加和替换
m1.appendTail(sb);
System.out.println(sb);

输出结果为:

lVOWELng lOng AgO, thE Is A mAn cAllEd JAck,
hE hAs OnE bOAt.

注意,上面的两个替换操作都只使用了一次replaceAll(),所以,与其编译为Pattern,不如直接使用StringreplaceAll()方法,而且开销也比较小。

  .

  .

  .

  .

 

Java Pattern Matcher 正则应用的更多相关文章

  1. java Pattern(正则)类

    Pattern的静态方法matches 用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串. Boolean b=Pattern.matches("^((13[0-9])|(15 ...

  2. Java Pattern Matcher 正则表达式需要转义的字符

    见:http://blog.csdn.net/bbirdsky/article/details/45368709 /** * 转义正则特殊字符 ($()*+.[]?\^{},|) * * @param ...

  3. java Pattern和Matcher详解

    结论:Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持. 单独用Pattern只能使用Pattern.matcher(String ...

  4. Java 中的正则(Pattern)

    /**String 中 replaceAll(),matches(),split() 等方法,都是调用Pattern中的方法.学习了,瞬间觉得Pattern强大了 public String repl ...

  5. 正则表达式 Pattern & Matcher

    1 compile and pattern Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,但可以通过Pattern.complie(Strin ...

  6. Java代码使用正则验证和常用工具方法

    1.正则验证邮箱 public static boolean checkEmail(String email){ boolean flag = false; try{ String check = & ...

  7. 优酷电视剧爬虫代码实现一:下载解析视频网站页面(4)补充: Java正则表达式Matcher.group(int group)相关类解析

    在Java正则表达式的相关类Matcher中,有如下几个方法: - int groupCount() - String group(int group) - int start(int group)  ...

  8. JAVA正则表达式matcher.find()和 matcher.matches()的区别

    1.find()方法是部分匹配,是查找输入串中与模式匹配的子串,如果该匹配的串有组还可以使用group()函数.matches()是全部匹配,是将整个输入串与模式匹配,如果要验证一个输入的数据是否为数 ...

  9. java Pattern

    public class Test{ //匹配替换掉order by之后的字符串 public static void main(String[] args) { Pattern pattern = ...

随机推荐

  1. IE 弹出框处理经验

    //各屏幕弹出窗样式 // 1366*768var style_1366x768 = "dialogWidth:950px;dialogHeight:650px;help:no;center ...

  2. c++ 简单的词法分析

    scanner.h #include<iostream> #include<fstream> #include<string> using namespace st ...

  3. cdoj 1134 男神的约会 状压dp

    题目链接 给一个10*10的方格, 每个格子里面有0-9,走到一个格子, 就要在这个格子待一段时间, 时间长度为这个格子的数字. 从左上角走到右下角, 要求0-9必须每种格子都要走到, 输出最短时间. ...

  4. Json.Net系列教程 3.Json.Net序列化和反序列化设置

    原文 Json.Net系列教程 3.Json.Net序列化和反序列化设置 上节补充 首先补充一点,Json.Net是支持序列化和反序列化DataTable,DataSet,Entity Framewo ...

  5. kinect for windows - SkeletonBasics-D2D详解之一

    之前的文章介绍了深度图的获取,但是深度图只是提供了一些数据,这些数据给上层应用使用还是偏底层一些,我们希望在这个基础上,获取一些信息,比如手挥动,人跑步,或者运动等等,那么这个文章开始我们来讲述kin ...

  6. 基于Visual C++2013拆解世界五百强面试题--题15-递归相加

    有一分数序列: 1/2 , 1/4 , 1/6 , 1/8 ......,用递归的方法,求此数列20项之和. 可以看出规律:每一项位1/n*2 这个很容易些递归,但是要注意一点,使用浮点数相除保存: ...

  7. ACM—循环小数转变成分数知识点_C++实现

    在小学的时候,我们的学生都能把“整数表示成分母是1的分数”,而且大多数学生也都能把有限小数和循环小数表示成分数的形式.这样,整数.分数.有限小数.循环小数都属于有理数.教科书中说“整数和分数统称有理数 ...

  8. poj 3264 Balanced Lineup(线段树、RMQ)

    题目链接: http://poj.org/problem?id=3264 思路分析: 典型的区间统计问题,要求求出某段区间中的极值,可以使用线段树求解. 在线段树结点中存储区间中的最小值与最大值:查询 ...

  9. 不可不知的HTML优化技巧

    如何提升Web页面的性能,很多开发人员从多个方面来下手如JavaScript.图像优化.服务器配置,文件压缩或是调整CSS. 很显然HTML 已经达到了一个瓶颈,尽管它是开发Web 界面必备的核心语言 ...

  10. iOS开发之第三方登录微信-- 史上最全最新第三方登录微信方式实现

    项目地址 :    https://github.com/zhonggaorong/weixinLoginDemo 最新版本的微信登录实现步骤实现: 1.在进行微信OAuth2.0授权登录接入之前,在 ...