public byte[] getBytes()方法使用平台默认的字符编码,将当前字符串转换为一个字节数组。如

byte d[] = "Java你好".getBytes();

如果平台默认的字符编码是GB_2312,那么调用getBytes()方法等同于调用getBytes("GB2312"),但需要注意的是带参数的getBytes(String charsetName)抛出UnsupportedEncodingException异常,因此必须在try-catch语句中调用getBytes(String charsetName)。

字节数组d其长度为8,该字节数组的d[0]、d[1]、d[2]和d[3]单元分别是字符J、a、v和a的编码,d[4]和d[5]单元存放的是字符‘你’的编码(GB_2312编码中,一个汉字占2个字节),d[6]和d[7]单元存放的是字符‘好’的编码。

String类的构造方法String(byte[])用指定的字节数组构造一个字符串对象。String(byte[], int offset, int length)构造方法用指定的字节数组的一部分,即从数组起始位置offset开始去length个字节构造一个字符串对象。

代码展示如下所示:

public class Test02 {

	public static void main(String[] args) {
// TODO Auto-generated method stub
byte d[] = "Java你好".getBytes();
String s = new String(d, 6, 2);
System.out.println(s);
s = new String(d, 0, 6);
System.out.println(s);
} }

 运行结果如下所示:

String类的构造方法String(char a[])和String(char a[], int offset, int length)分别用数组a中的全部字符和部分字符创建字符串对象。String类也提供了将字符串存放在数组中的方法:public void getChars(int start, int end, char c[], int offset)。

字符串调用getChars()方法将当前字符串中的一部分字符复制到参数c指定的数组中,将字符串中从位置start到end-1位置上的字符复制到数组c中,并从数组c的offset处开始存放这些字符。需要注意的是,必须保证数组c能够容纳下要被复制的字符。当然追求简练的话可以使用方法: public char[] toCharArray()。

正则表达式

一个正则表达式含有一些具有特殊意义字符的字符串,这些特殊字符称作为正则表达式中的元字符。比如,"\dcat"中的\\d就是有特殊意义的元字符,代表0到9中的任何一个。

字符串对象调用public boolean matches(String regex)方法可以判断当前字符串对象是否和参数regex指定的正则表达式匹配。列出部分常用的元字符如下所示:

图片如下:

除了"."以外的元字符,在正则表达式中的写法都要在前面加上一个“\”,如元字符\d写法是“\\d”。

在正则表达式中可以用方括号括起若干个字符来表示一个元字符,该元字符代表方括号中的任何一个字符。例如regex="[159]ABC",那么"1ABC"、“5ABC”和“9ABC”都是和正则表达式regex匹配的字符串。例如,

[abc]:代表a、b、c中的任何一个;

[^abc]:代表除了a、b、c以外的任何字符;

[a-zA-Z]:代表英文字母(包括大写和小写)中的任何一个;

[a-d]:代表a至d中的任何一个。

另外,中括号里允许嵌套中括号,可以进行并、交、差运算,例如,

[a-d[m-p]]:代表a~d,或m~p中的任何字符;

[a-z&&[def]]:代表d、e或f中的任何一个(交);

[a-f&&[^bc]]:代表a、d、e、f(差)。

由于"."代表任何一个字符,所以在正则表达式中如果想使用普通意义的点字符,必须使用[.]或用\56表示普通意义的点字符。

在正则表达式中可以使用限定修饰符。比如,对于限定修饰符?,如果x代表正则表达式中的一个元字符或普通字符,那么x?就表示x出现0次或1次,例如:

regex = "hello[2468]?";

那么"hello","hello2","hello4","hello6"和"hello8"都是与正则表达式regex匹配的字符串。

常用的限定修饰符的用法如下所示:

带限定修饰符的模式

意义

X?

X*

X+

X{n}

X{n,}

X{n,m}

XY

X|Y

X出现0次或1次

X出现0次或多次

X出现1次或多次

X恰好出现n次

X至少出现n次

X出现n次至m次

X的后缀是Y

X或Y

比如regex="@\\w{4}",那么"@abcd",“@天道酬勤”, "@Java“和"@bird"都是与正则表达式regex匹配的字符串。

正则表达式的细节可以在java.util.regex包中的Pattern类中查到。

matches()方法的测试结果如下所示:

public class Testo3 {

	public static void main(String[] args) {
// TODO Auto-generated method stub
String regex = "[a-zA-Z]+";
Scanner reader = new Scanner(System.in);
String str = reader.nextLine();
if(str.matches(regex))
{
System.out.println(str + "中的字符都是英文字母");
}
} }

 运行结果如下所示:

字符串的替换

public String replaceAll(String regex, String replacement)方法返回一个字符串,该字符串是将当前字符中的所有和参数regex指定的正则表达式匹配的子字符串用参数replacement指定的字符串替换后的字符串,例如:

String s = "12hello567bird".replaceAll("[a-zA-Z]+","你好"};

那么s的结果就是“12你好567你好”。

replaceAll()方法返回一个字符串,但不改变当前字符串。代码展示如下所示:

public class Test04 {

	public static void main(String[] args) {
// TODO Auto-generated method stub
String str = "欢迎大家访问http://www.xiaojiang.cn了解、参观公司";
String regex = "(http://)?www[.]\\w+\56{1}\\p{Alpha}+";
System.out.println("原字符串是:" + str + "替换后是:");
str = str.replaceAll(regex, "***");
System.out.println(str);
String money = "89,235,678¥";
System.out.println(money + "转化成数字:");
String s = money.replaceAll("[,\\p{Sc}]" ,"");//"\\p{Sc}"可匹配任何货币符号
long number = Long.parseLong(s);
System.out.println(number);
} }

运行结果如下所示:

字符串的分解也会用到正则表达式

String str = "1949年10月1日是中华人民共和国成立的日子";

String regex = "\\D+";

String digitWord[] = str.split(regex);

public class Test05 {

	public static void main(String[] args) {
// TODO Auto-generated method stub
String str = "1949年10月1日是中华人民共和国成立的日子";
String regex = "\\D+";
String digitWord[] = str.split(regex);
for(String s : digitWord)
{
System.out.print(s + " ");
}
} }

 运行结果如下所示:

将正则表达式和split()方法结合使用情况如下所示,输入一条英语句子,分隔出每个单词。

import java.util.Scanner;

public class Test06 {

    public static void main(String[] args) {
// TODO Auto-generated method stub
System.out.println("请输入一行文本");
Scanner reader = new Scanner(System.in);
String str = reader.nextLine();
String regex = "[\\s\\d\\p{Punct}]+";
String word[] = str.split(regex);
for(String s : word)
{
System.out.println(s);
}
} }

运行结果如下:

review11的更多相关文章

随机推荐

  1. [JavaScript] this、call和apply详解

    在JavaScript编程中,理解this.call和apply是道槛,如果能正确的理解它们的本质及其应用.那么在以后的JavaScript中会得心应手. this 跟别的语言大相径庭的是,JavaS ...

  2. 移动端之touch事件--手指的滑动事件

    转自[B5教程网]:http://www.bcty365.com/content-142-5243-1.html 总结:touchmove的最后坐标减去touchstart的起始坐标.X的结果如果正数 ...

  3. event对象及各种事件

    事件(event) event对象 (1)什么是event对象? Event 对象代表事件的状态,比如事件在其中发生的元素.键盘按键的状态.鼠标的位置.鼠标按钮的状态.事件通常与函数结合使用,函数不会 ...

  4. 【转】NPIV - 连接虚拟机与存储的桥梁

    转自:http://blog.csdn.net/jewes/article/details/7705895 解决什么问题 我们知道在存储区域网络(SAN:storage area network),主 ...

  5. netty http客户端从web服务器获取消息遇到的HttpChunk问题

    有时候,Web服务器生成HTTP Response是无法在Header就确定消息大小的,这时一般来说服务器将不会提供Content-Length的头信息,而采用Chunked编码动态的提供body内容 ...

  6. Docker介绍及优缺点对比分析

    1.什么是Docker Docker最初是dotCloud公司创始人Solomon Hykes在法国期间发起的一个公司内部项目,于2013年3月以Apache 2.0授权协议开源,主要项目代码在Git ...

  7. javascript实例:显示时间

    <!doctype html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  8. Android系统移植与调试之------->build.prop文件详细赏析

    小知识:什么是build.prop?   /system/build.prop 是一个属性文件,在Android系统中.prop文件很重要,记录了系统的设置和改变,类似於/etc中的文件.这个文件是如 ...

  9. hive bin下的进入beeline 命令行和hive有什么不同?

    Hive 0.11中引入的HiveServer2有一个自己的CLI叫Beeline. HiveCLI现在已经过时,与Beeline相比,其缺少多用户.安全和其他与HiveServer2兼容的特性. 从 ...

  10. Latex技巧:插入参考文献

    LaTeX插入参考文献,可以使用BibTex,也可以不使用BibTex. 方法一:不使用BibTeX 先在文章文章末尾写好需要插入的参考文献,逐一写出,例如: \begin{thebibliograp ...