Java对正则表达式的支持主要体现在String、Pattern、Matcher和Scanner类。

 1.Pattern、Matcher

  先看一个Pattern和Matcher类使用正则表达式的例子。

public class PatternTest {    

    public static void main(String [ ] args) {
String testString = "abcabcabcdefabc";
String [] regexs = new String []{"abc+","(abc)+","(abc){2,}"}; for(String regex:regexs){
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(testString); System.out.println("test regex: " + regex);
while(m.find()){
System.out.println("match " + m.group() + " at position " + m.start() + "-" + (m.end() -1));
}
}
} }

  运行的结果为:

test regex: abc+
match abc at position 0-2
match abc at position 3-5
match abc at position 6-8
match abc at position 12-14
test regex: (abc)+
match abcabcabc at position 0-8
match abc at position 12-14
test regex: (abc){2,}
match abcabcabc at position 0-8

  先对几个正则表达式的含义进行解释:

  abc+:匹配abc或者abcc或者abccc等。

  (abc)+:根据贪婪原则,匹配1次或者多次连续的abc,匹配最长的字符串。

  (abc){2,}:abc至少出现2次,匹配abcabc或者abcabcabc等。

  测试一个字符串是否匹配某个正则表达式,可以使用下面的方法:

String testString = "abcabcabcdefabc";
System.out.println(Pattern.matches("abc+", testString));
System.out.println(Pattern.matches("abc+", "abccc"));

  输出结果为:false 和 true。

  查看子匹配的方法如下,使用group方法:

import java.util.regex.Matcher;
import java.util.regex.Pattern; public class PatternTest2 { public static void main(String [ ] args) {
String poem = "'Twas brillig,and the slithy toves\n" +
"Did gyre and gimble in the wabe.\n" +
"All mimsy were the borogoves,\n" +
"And the mome raths outgrabe."; Pattern p = Pattern.compile("(?m)(\\S+)\\s(\\S+\\s\\S+)$");
Matcher m = p.matcher(poem);
while(m.find()){
for(int i=0;i<= m.groupCount();i++){
System.out.print("[" + m.group(i) + "]");
}
System.out.println("");
}
} }

  输出的结果为:

[the slithy toves][the][slithy toves]
[in the wabe.][in][the wabe.]
[were the borogoves,][were][the borogoves,]
[mome raths outgrabe.][mome][raths outgrabe.]

  需要解释的是:

  (?m)指明了是多行模式,否则“$”只会指向结尾的位置,加上了(?m),“$”指向每行的结尾位置。

  (\\S+)\\s(\\S+\\s\\S+)$表示每行结尾处的3个字符,需要注意这里面还包含了2个子匹配,代码中用 m.group(i)获取了子匹配的内容。

  

  如果希望在匹配时忽略大小写和支持多行模式,应该使用下面的代码:

import java.util.regex.Matcher;
import java.util.regex.Pattern; public class PatternTest3 { public static void main(String [ ] args) {
String testString = "java hava regex\n" +
"JAVA hava regex\n" +
"Java hava regex"; Pattern p = Pattern.compile("^java",Pattern.CASE_INSENSITIVE | Pattern.MULTILINE);
Matcher m = p.matcher(testString);
while(m.find()){
System.out.println(m.group());
}
}
}

  输出结果为:

java
JAVA
Java

  Pattern.CASE_INSENSITIVE(?i)--忽略大小写

  Pattern.MULTILINE(?m)--支持多行模式

  Pattern.COMMENTS(?x)--忽略大小写

  将匹配结果分割成数组,可以使用split方法,String的split方法 也支持正则表达式,如下面的例子:

public class RegexSplit {

    public static void main(String [ ] args) {
String testString = "This!!unusual use!!of exclamation!!points"; Pattern p = Pattern.compile("!!");
String [] sts = p.split(testString);
for(String st:sts){
System.out.print(st +"|");
}
System.out.println();
sts = p.split(testString,3);
for(String st:sts){
System.out.print(st+"|");
}
} }

  正则表达式的替换操作,replaceFirst和replaceAll,复杂的替换操作需要appendReplacement来完成,如下:

import java.util.HashMap;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern; public class RegexExam {
public static void main(String args[]) {
String template = "尊敬的客户${customerName}你好!本次消费金额${amount},"
+ "您帐户${accountNumber}上的余额为${balance},欢迎下次光临!";
HashMap<String, String> data = new HashMap<String, String>();
data.put("customerName", "刘明");
data.put("accountNumber", "888888888");
data.put("balance", "$1000000.00");
data.put("amount", "$1000.00");
try {
System.out.println(composeMessage(template, data));
}
catch (Exception e) {
e.printStackTrace();
}
} public static String composeMessage(String template, Map<String, String> data)
throws Exception {
//这里使用勉强式匹配.+?,使用贪婪式匹配.+结果是不正确的
String regex = "\\$\\{(.+?)\\}";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(template);
/*
* sb用来存储替换过的内容,它会把多次处理过的字符串按源字符串序
* 存储起来。
*/
StringBuffer sb = new StringBuffer();
while (matcher.find()) {
String name = matcher.group(1);//键名
String value = (String) data.get(name);//键值
if (value == null) {
value = "";
}
else {
/*
* $和\都是特殊字符,表示字符$需要转义\$
* 要把 $ 替换成 \$ ,则要使用 \\\\\\$来替换,java中的\是特殊字符,用\\表示正则表达式中的\
* value的结果仍是一个正则表达式,会在下面使用
*/
value = value.replaceAll("\\$", "\\\\\\$");
//System.out.println("value=" + value);
}
/*
* 经过上面的替换操作,现在的 value 中含有 $ 特殊字符的内容被换成了"\$1000.00"
*/
matcher.appendReplacement(sb, value);
System.out.println("sb = " + sb.toString());
}
//最后还得要把尾串接到已替换的内容后面去,这里尾串为“,欢迎下次光临!”
matcher.appendTail(sb);
return sb.toString();
}
}

  运行的结果为:

尊敬的客户刘明你好!本次消费金额$1000.00,您帐户888888888上的余额为$1000000.00,欢迎下次光临!

  重置,将Mathcer对象应用于一个新的字符串:

import java.util.regex.Matcher;
import java.util.regex.Pattern; public class RegexReset { public static void main(String [ ] args) {
String str = "fix the rug with bags"; Pattern pattern = Pattern.compile("[frb][aiu][gx]");
Matcher matcher = pattern.matcher(str);
while(matcher.find()){
System.out.print(matcher.group() + " ");
}
System.out.println();
matcher.reset("fix the rig with rags");
while(matcher.find()){
System.out.print(matcher.group() + " ");
}
} }

  输出的结果为:

fix rug bag
fix rig rag

Java对正则表达式的支持(一)的更多相关文章

  1. Java对正则表达式的支持(二)

    正则表达式的主要用途: a.在目标字符串中找出匹配正则表达式的部分 b.校验目标字符串是否符合正则表达式,例如校验邮箱地址 c.在目标字符串中替换符合正则表达式的部分为其他的字符串 Scanner类是 ...

  2. java中正则表达式基本用法

    正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它 用以描述在查找文字主体时待匹配的一个或多个字符串.正则表达式作为 ...

  3. Java与正则表达式

    Java与正则表达式 标签: Java基础 正则 正如正则的名字所显示的是描述了一个规则, 通过这个规则去匹配字符串. 学习正则就是学习正则表达式的语法规则 正则语法 普通字符 字母, 数字, 汉字, ...

  4. 1000行代码徒手写正则表达式引擎【1】--JAVA中正则表达式的使用

    简介: 本文是系列博客的第一篇,主要讲解和分析正则表达式规则以及JAVA中原生正则表达式引擎的使用.在后续的文章中会涉及基于NFA的正则表达式引擎内部的工作原理,并在此基础上用1000行左右的JAVA ...

  5. java中正则表达式基本用法(转)

    https://www.cnblogs.com/xhj123/p/6032683.html 正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符( ...

  6. JS和PHP和JAVA的正则表达式的区别(java没有分解符,java中的转义字符是\\)

    JS和PHP和JAVA的正则表达式的区别(java没有分解符,java中的转义字符是\\) 一.总结 js正则:var patrn=/^[0-9]{1,20}$/; php正则:$pattern='/ ...

  7. js and java 中正则表达式的使用

    首先介绍一下js当中的几个关键的正则表达式: 1.js中的正则表达式校验 a: RegExp(如果这里有转义字符的话,需要使用“\\”) var patt1=new RegExp("e&qu ...

  8. Java中正则表达式的使用(常用的方法)

    这两天回想了一下正则表达式的使用,顺便就总结了一下java的javascript中使用正则表达式的用法,需要看javascript中使用正则的朋友可以看我的另一篇总结,下面我就简单的介绍一下java中 ...

  9. java基础---->java中正则表达式二

    跟正则表达式相关的类有:Pattern.Matcher和String.今天我们就开始Java中正则表达式的学习. Pattern和Matcher的理解 一.正则表达式的使用方法 一般推荐使用的方式如下 ...

随机推荐

  1. Docker+Jenkins持续集成环境(2)使用docker+jenkins构建nodejs前端项目

    前文使用Docker搭建Jenkins+Docker持续集成环境我们已经搭建了基于docker+jenkins的持续集成环境,并构建了基于maven的项目.这一节,我们继续扩展功能,增加对Nodejs ...

  2. [数据预处理]-中心化 缩放 KNN(一)

    据预处理是总称,涵盖了数据分析师使用它将数据转处理成想要的数据的一系列操作.例如,对某个网站进行分析的时候,可能会去掉 html 标签,空格,缩进以及提取相关关键字.分析空间数据的时候,一般会把带单位 ...

  3. mysql 远程连接数据库的二种方法

    一.连接远程数据库: 1.显示密码 如:MySQL 连接远程数据库(192.168.5.116),端口"3306",用户名为"root",密码"123 ...

  4. url加密,一般只对参数加密

    首先,很不推荐你使用get方式发送密码,最好是使用post. 原因是,你通过一个连接把用户名和密码发送到后台,即便密码不是明文,别人获取不到密码明文,但是,只要你这个连接成功登陆过,别人就可以拿这个连 ...

  5. [机器学习]-[数据预处理]-中心化 缩放 KNN(二)

    上次我们使用精度评估得到的成绩是 61%,成绩并不理想,再使 recall 和 f1 看下成绩如何? 首先我们先了解一下 召回率和 f1. 真实结果 预测结果 预测结果   正例 反例 正例 TP 真 ...

  6. 滑稽的下午--angularjs 2.0管道的使用

    虽然angular 已经迎来4.0时代,可我还在苦逼的看2.0. 下午有个任务: 让一个component组件里的时间显示当前时间并自动刷新. 过程: 1.首先获取当前时间 new Date(); 2 ...

  7. 关于Set<Long>Map<Long,String>的一些小注意事项 自动转换类型

  8. 寄存器(CPU原理)

    body, table{font-family: 微软雅黑; font-size: 13.5pt} table{border-collapse: collapse; border: solid gra ...

  9. ASP.net core 2.0.0 中 asp.net identity 2.0.0 的基本使用(三)—用户账户及cookie配置

    修改用户账户及cookie配置 一.修改密码强度和用户邮箱验证规则: 打开Startup.cs,找到public void ConfigureServices(IServiceCollection s ...

  10. Redis-安装、启动

    安装Redis 下载redis安装包http://download.redis.io/redis-stable.tar.gz 解压安装包tar xzf redis-stable.tar.gz 安装cd ...