Java性能优化之String字符串优化
字符串是软件开发中最重要的对象之一。通常,字符串对象在内存中是占据了最大的空间块,因此如何高效地处理字符串,必将是提高整体性能的关键所在。
1.字符串对象及其特点
Java中八大基本数据类型没有String类型,因为String类型是Java对char数组的进一步封装。
String类的实现主要由三部分组成:char数组,offset偏移量,String的长度。
String类型有三个基本特点:
不变性
不变性是指String对象一旦生成,则不能再对它进行改变。
不变性的作用在于当一个对象需要被多线程共享,并且频繁访问时,可以省略同步和锁等待的时间,从而大幅提高系统性能。
针对常量池的优化
当两个String对象拥有相同的值时,它们只引用常量池中的同一个拷贝。
类的final定义
作为final类的String对象在系统中不能有任何子类,这是对系统安全性的保护!
1.1 subString()方法的内存泄漏
关于这一点,在JDK的1.7及以后就已经解决了!
在1.7之前,subString()方法截取字符串只是移动了偏移量,截取之后的字符串实际上还是原来的大小。
现在,当使用subString()方法截取字符串时会把截取后的字符串拷贝到新对象。
1.2 字符串分割与查找
1、原始的String.split()
String.split()方法使用简单,功能强大,支持正则表达式,但是,在性能敏感的系统中频繁的使用这个方法是不可取的。
注意 * ^ : | . 这些符号记得\\转义
2、使用效率更高的StringTokenizer类分割字符串
StringTokenizer类是JDK中提供的专门用来处理字符串分割的工具类。构造方法:
public StringTokenizer(String str, String delim, boolean returnDelims)
其中str是要分割的字符串,delim是分割符,returnDelims是否返回分隔符,默认false。
String s = "a;b;c";
StringTokenizer stringTokenizer = new StringTokenizer(s, ";", false);
System.out.println(stringTokenizer.countTokens());
while (stringTokenizer.hasMoreTokens()) {
System.out.println(stringTokenizer.nextToken());
}
3、最优化的字符串分割方式
indexOf()方法是一个执行速度非常快的方法,subString()是采用了时间换空间技术,因此速度相对快。
public static List<String> mySplit(String str, String delim){
List<String> stringList = new ArrayList<>();
while(true) {
int k = str.indexOf(delim);
if (k < 0){
stringList.add(str);
break;
}
String s = str.substring(0, k);
stringList.add(s);
str = str.substring(k+1);
}
return stringList;
}
4、三种分割方法的对比与选择
split()方法功能强大,但是效率最差;
StringTokenizer性能优于split方法,能用StringTokenizer就没必要用split();
自己实现的分割算法性能最好,但代码的可读性和系统的可维护性最差,只有当系统性能成为主要矛盾时,才推荐使用该方法。
5、高效率的charAt方法
charAt(int index) 返回指定索引处的 char 值。功能和indexOf()相反,效率却一样高。
6、字符串前后辍判断
public boolean startsWith(String prefix) 测试此字符串是否以指定的前缀开始
public boolean endsWith(String suffix) 测试此字符串是否以指定的后缀结束
这两个Java内置函数效率远远低于charAt()方法。单元测试:
@Test
public void test(){
String str = "hello";
if (str.charAt(0)=='h'&&str.charAt(1)=='e'){
System.out.println(true);
}
if (str.startsWith("he")){
System.out.println(true);
}
}
1.3 StringBuffer和StringBuilder
1、String常量的累加操作
String s = "123"+"456"+"789";
虽然从理论上说字符串的累加的效率并不高,但该语句执行耗时为0;反编译代码后,我们发现代码是
String s = "123456789";
显然,是Java在编译时做了充分的优化。因此,并没有想象中那样生成大量的String实例。
对于静态字符串的连接操作,Java在编译时会进行彻底的优化,将多个连接操作的字符串在编译时合成一个单独的长字符串。
2、String变量累加的操作
String str = "hello";
str+="word";
str+="!!!";
我们利用“+=”改变字符串内容的值,实际上字符串根本没有改变。
当 str+="word" 时,堆内存开辟了word的内存空间和helloword的两个内存空间(相当于实例化了两个String对象),并把str的引用指向了helloword,原来的hello和word成为了垃圾被JVM回收。
3、concat() 连接字符串
String的concat()是专门用于字符串连接操作的方法,效率远远高于“+”或者“+=”。
4、StringBuffer和StringBuilder
不用多说了,就是为字符串连接而生的,效率最高。不同的是,StringBuffer几乎对所有的方法都做了同步,StringBuilder并没有做任何同步,效率更高一些。只不过在多线程系统中,StringBuilder无法保证线程安全,不能使用。
5、容量参数
StringBuffer和StringBuilder的是对String的封装,String是对char数组的封装。是数组就有大小,就有不够用的时候,不够用只能扩容,也就是把原来的再复制到新的数组中。合适的容量参数自然能够减少扩容的次数,达到提高效率的目的。
在初始化时,容量参数默认是16个字节。在构造方法中指定容量参数:
public StringBuilder(int capacity)
1.4 附一些实用的方法
判断字符串相等(忽略大小写)
equalsIgnoreCase(String anotherString)
判断是否存在子字符串(返回布尔类型)
contains(CharSequence s)
将指定字符串连接到此字符串的结尾
concat(String str)
使用指定的格式字符串和参数返回一个格式化字符串
format(String format, Object... args)
使用默认语言环境的规则将此 String 中的所有字符都转换为小写。
toLowerCase()
使用默认语言环境的规则将此 String 中的所有字符都转换为大写。
toUpperCase()
返回字符串的副本,忽略前导空白和尾部空白。
trim()
使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。
String replaceAll(String regex, String replacement)
按字典顺序比较两个字符串,不考虑大小写。
int compareToIgnoreCase(String str)
- 如果参数字符串等于此字符串,则返回值 0;
- 如果此字符串小于字符串参数,则返回一个小于 0 的值;
- 如果此字符串大于字符串参数,则返回一个大于 0 的值。
本文参考《Java程序性能优化》葛一鸣著
Java性能优化之String字符串优化的更多相关文章
- JAVA基础——重新认识String字符串
深入剖析Java之String字符串 在程序开发中字符串无处不在,如用户登陆时输入的用户名.密码等使用的就是字符串. 在 Java 中,字符串被作为 String 类型的对象处理. String 类位 ...
- Java性能之synchronized锁的优化
synchronized / Lock 1.JDK 1.5之前,Java通过synchronized关键字来实现锁功能 synchronized是JVM实现的内置锁,锁的获取和释放都是由JVM隐式实现 ...
- 【原创】使用Java进行Clob转String字符串
背景 oracle字段类型varchar2最大长度4000,超过的怎么办 解决 使用clob类型,大字段,无长度限制 问题 使用Java的JDBC读取的RS获取的clob类型无法正常使用,封装的rs. ...
- Java 性能优化之 String 篇
原文:http://www.ibm.com/developerworks/cn/java/j-lo-optmizestring/ Java 性能优化之 String 篇 String 方法用于文本分析 ...
- java性能优化--字符串优化处理
String对象 String对象是java中重要的数据类型,在大部分情况下我们都会用到String对象.其实在Java语言中,其设计者也对String做了大量的优化工作,这些也是String对象的特 ...
- String字符串性能优化的几种方案
String字符串是系统里最常用的类型之一,在系统中占据了很大的内存,因此,高效地使用字符串,对系统的性能有较好的提升. 针对字符串的优化,我在工作与学习过程总结了以下三种方案作分享: 一.优化构建的 ...
- String字符串性能优化的探究
一.背景 String 对象是我们使用最频繁的一个对象类型,但它的性能问题却是最容易被忽略的.String 对象作为 Java 语言中重要的数据类型,是内存中占用空间最大的一个对象,高效地使用字符串, ...
- JAVA程序优化之字符串优化处理
字符串是软件开发中最为重要的对象之一.通常,字符串对象或其等价对象(如char数组),在内存中总是占据了最大的空间块.因此如何高效地处理字符串,必将是提高系统整体性能的关键所在. 1.String对象 ...
- Java性能优化的50个细节(珍藏版)
原文地址:https://www.toutiao.com/i6595499804082569742/ 在JAVA程序中,性能问题的大部分原因并不在于JAVA语言,而是程序本身.养成良好的编码习惯非常重 ...
随机推荐
- mysql之外键
本文内容: 什么是外键 外键的增加 外键的修改和删除 外键的约束模式 首发日期:2018-04-12 什么是外键: 外键就是表中存在一个字段指向另外一个表的主键,那么这个字段就可以称为外键. 一张表可 ...
- Python之__new__方法
# -*- coding: utf-8 -*- """ Created on Sun Dec 2 11:03:03 2018 Python类构造过程 @author: z ...
- spring静态代理和动态代理
本节要点: Java静态代理 Jdk动态代理 1 面向对象设计思想遇到的问题 在传统OOP编程里以对象为核心,并通过对象之间的协作来形成一个完整的软件功能,由于对象可以继承,因此我们可以把具有相同功能 ...
- [20180904]工作中一个错误.txt
[20180904]工作中一个错误.txt --//昨天看我提交一份修改建议,发现自己写的sql语句存在错误.--//链接:http://blog.itpub.net/267265/viewspace ...
- 我在 Mac 上都用什么
我在 Mac 上都用什么 Homebrew Homebrew 是统一管理 macOS 中应用的最佳方法之一,而且大量优秀的应用都可以在 Homebrew 中找到. 就不做过多介绍了, 有兴趣可以看相关 ...
- 教你用Python Jupyter Notebook 制作代码分享 PPT
PPT 是个强大的工具,但是笔者的 PPT 制作技术不咋地,所以之前的分享习惯使用 Jupyter Notebook + RISE,这样使用简单的 markdown 格式加上代码就足够做一次代码分享了 ...
- Python: datetime 转换
Directive Meaning Example Notes %a Weekday as locale’s abbreviated name. Sun, Mon, …, Sat (en_US); S ...
- {windows故障}关于WIN7故障模块StackHash_0a9e解决方法
问题背景:我给同事重装好系统后,想用驱动精灵(网卡版)给新系统安装驱动,但是在安装驱动精灵的过程中老是出现标题的问题,windows停止工作,导致无法安装,最后看到这两个方法后,把网络适配器禁用,然后 ...
- php学习----异常处理(接上篇)
PHP异常处理之抛出一个异常 从PHP5开始,PHP支持异常处理,异常处理是面向对象一个重要特性,PHP代码中的异常通过throw抛出,异常抛出之后,后面的代码将不会再被执行. 既然抛出异常会中断程序 ...
- SpringCloud之初识Robbin---负载均衡
在上一篇中讲解Eureka注册中心的案例,我们启动了一个user-service,然后通过DiscoveryClient来获取服务实例信息,然后获取ip和端口来访问. 但是实际环境中,我们往往会开启很 ...