Java 源码刨析

【String 是如何实现的？它有哪些重要的方法？】

String 内部实际存储结构为 char 数组，源码如下：

public final class String

implements java.io.Serializable, Comparable<String>, CharSequence {

// 用于存储字符串的值

private final char value[];

// 缓存字符串的 hash code

private int hash; // Default to 0

// ......其他内容

}

String 源码中包含下面几个重要的方法。

1. 多构造方法

// String 为参数的构造方法

public String(String original) {

this.value = original.value;

this.hash = original.hash;

}

// char[] 为参数构造方法

public String(char value[]) {

this.value = Arrays.copyOf(value, value.length);

}

// StringBuffer 为参数的构造方法

public String(StringBuffer buffer) {

synchronized(buffer) {

this.value = Arrays.copyOf(buffer.getValue(), buffer.length());

}

// StringBuilder 为参数的构造方法

public String(StringBuilder builder) {

this.value = Arrays.copyOf(builder.getValue(), builder.length());

}

2. equals() 比较两个字符串是否相等

public boolean equals(Object anObject) {

// 对象引用相同直接返回 true

if (this == anObject) {

return true;

}

// 判断需要对比的值是否为 String 类型，如果不是则直接返回 false

if (anObject instanceof String) {

String anotherString = (String)anObject;

int n = value.length;

if (n == anotherString.value.length) {

// 把两个字符串都转换为 char 数组对比

char v1[] = value;

char v2[] = anotherString.value;

int i = 0;

// 循环比对两个字符串的每一个字符

while (n-- != 0) {

// 如果其中有一个字符不相等就 true false，否则继续对比

if (v1[i] != v2[i])

return false;

i++;

}

return true;

}

return false;

}

String 类型重写了 Object 中的 equals() 方法，equals() 方法需要传递一个 Object 类型的参数值，在比较时会先通过 instanceof 判断是否为 String 类型，如果不是则会直接返回 false，instanceof 的使用如下：

Object oString = "123";

Object oInt = 123;

System.out.println(oString instanceof String); // 返回 true

System.out.println(oInt instanceof String); // 返回 false

还有一个和 equals() 比较类似的方法 equalsIgnoreCase()，它是用于忽略字符串的大小写之后进行字符串对比。

3. compareTo() 比较两个字符串

compareTo() 方法用于比较两个字符串，返回的结果为 int 类型的值，源码如下：

public int compareTo(String anotherString) {

int len1 = value.length;

int len2 = anotherString.value.length;

// 获取到两个字符串长度最短的那个 int 值

int lim = Math.min(len1, len2);

char v1[] = value;

char v2[] = anotherString.value;

int k = 0;

// 对比每一个字符

while (k < lim) {

char c1 = v1[k];

char c2 = v2[k];

if (c1 != c2) {

// 有字符不相等就返回差值

return c1 - c2;

}

k++;

}

return len1 - len2;

}

从源码中可以看出，compareTo() 方法会循环对比所有的字符，当两个字符串中有任意一个字符不相同时，则 return char1-char2。

还有一个和 compareTo() 比较类似的方法 compareToIgnoreCase()，用于忽略大小写后比较两个字符串。

可以看出 compareTo() 方法和 equals() 方法都是用于比较两个字符串的，但它们有两点不同：

equals() 可以接收一个 Object 类型的参数，而 compareTo() 只能接收一个 String 类型的参数；

equals() 返回值为 Boolean，而 compareTo() 的返回值则为 int。

它们都可以用于两个字符串的比较，当 equals() 方法返回 true 时，或者是 compareTo() 方法返回 0 时，则表示两个字符串完全相同。

4. 其他重要方法

indexOf	查询字符串首次出现的下标位置
lastIndexOf	查询字符串最后出现的下标位置
contains	查询字符串中是否包含另一个字符串
toLowerCase	把字符串全部转换成小写
toUpperCase	把字符串全部转换成大写
length	查询字符串的长度
trim	去掉字符串首尾空格
replace	替换字符串中的某些字符
split	把字符串分割并返回字符串数组
join	把字符串数组转为字符串

【== 和 equals 的区别】

== 对于基本数据类型来说，是用于比较 "值"是否相等的；而对于引用类型来说，是用于比较引用地址是否相同的。

查看源码我们可以知道 Object 中也有 equals() 方法，源码如下：

public boolean equals(Object obj) {

return (this == obj);

}

可以看出，Object 中的 equals() 方法其实就是 ==，而 String 重写了 equals() 方法把它修改成比较两个字符串的值是否相等。

【final 修饰的好处】

从 String 类的源码我们可以看出 String 是被 final 修饰的不可继承类，源码如下：

public final class String

implements java.io.Serializable, Comparable<String>, CharSequence { //...... }

那这样设计有什么好处呢？

Java 语言之父 James Gosling 的回答是，他会更倾向于使用 final，因为它能够缓存结果，当你在传参时不需要考虑谁会修改它的值；如果是可变类的话，则有可能需要重新拷贝出来一个新值进行传参，这样在性能上就会有一定的损失。

James Gosling 还说迫使 String 类设计成不可变的另一个原因是安全，当你在调用其他方法时，比如调用一些系统级操作指令之前，可能会有一系列校验，如果是可变类的话，可能在你校验过后，它的内部的值又被改变了，这样有可能会引起严重的系统崩溃问题，这是迫使 String 类设计成不可变类的一个重要原因。

总结来说，使用 final 修饰的第一个好处是安全；第二个好处是高效，以 JVM 中的字符串常量池来举例，如下两个变量：

String s1 = "java";

String s2 = "java";

只有字符串是不可变时，我们才能实现字符串常量池，字符串常量池可以为我们缓存字符串，提高程序的运行效率，如下图所示：

试想一下如果 String 是可变的，那当 s1 的值修改之后，s2 的值也跟着改变了，这样就和我们预期的结果不相符了，因此也就没有办法实现字符串常量池的功能了。

【String 和 StringBuilder、StringBuffer 的区别】

因为 String 类型是不可变的，所以在字符串拼接的时候如果使用 String 的话性能会很低，

因此我们就需要使用另一个数据类型 StringBuffer，它提供了 append 和 insert 方法可用于字符串的拼接，它使用 synchronized 来保证线程安全，如下源码所示：

@Override

public synchronized StringBuffer append(Object obj) {

toStringCache = null;

super.append(String.valueOf(obj));

return this;

}

@Override

public synchronized StringBuffer append(String str) {

toStringCache = null;

super.append(str);

return this;

}

因为它使用了 synchronized 来保证线程安全，所以性能不是很高；

于是在 JDK 1.5 就有了 StringBuilder，它同样提供了 append 和 insert 的拼接方法，但它没有使用 synchronized 来修饰，因此在性能上要优于 StringBuffer，所以在非并发操作的环境下可使用 StringBuilder 来进行字符串拼接。

【String 和 JVM】

String 常见的创建方式有两种，new String() 的方式和直接赋值的方式；

直接赋值的方式会先去字符串常量池中查找是否已经有此值，如果有则把引用地址直接指向此值，否则会先在常量池中创建，然后再把引用指向此值；

而 new String() 的方式一定会先在堆上创建一个字符串对象，然后再去常量池中查询此字符串的值是否已经存在，如果不存在会先在常量池中创建此字符串，然后把引用的值指向此字符串，如下代码所示：

String s1 = new String("Java");

String s2 = s1.intern();

String s3 = "Java";

System.out.println(s1 == s2); // false

System.out.println(s2 == s3); // true

它们在 JVM 存储的位置，如下图所示：

JDK 1.7 之后把永生代换成了元空间，把字符串常量池从方法区移到了 Java 堆上。

除此之外编译器还会对 String 字符串做一些优化，例如以下代码：

String s1 = "Ja" + "va";

String s2 = "Java";

System.out.println(s1 == s2);

虽然 s1 拼接了多个字符串，但对比的结果却是 true。

代码 "Ja"+"va" 被直接编译成了 "Java" ，因此 s1==s2 的结果才是 true，这就是编译器对字符串优化的结果。

from：Java 源码剖析（https://kaiwu.lagou.com/course/courseInfo.htm?courseId=59#/detail/pc?id=1761）

Java 源码刨析 - String的更多相关文章

Java 源码刨析 - HashMap 底层实现原理是什么？JDK8 做了哪些优化？
[基本结构] 在 JDK 1.7 中 HashMap 是以数组加链表的形式组成的: JDK 1.8 之后新增了红黑树的组成结构,当链表大于 8 并且容量大于 64 时,链表结构会转换成红黑树结构,它的 ...
Java 源码刨析 - 线程的状态有哪些？它是如何工作的？
线程(Thread)是并发编程的基础,也是程序执行的最小单元,它依托进程而存在. 一个进程中可以包含多个线程,多线程可以共享一块内存空间和一组系统资源,因此线程之间的切换更加节省资源.更加轻量化,也因 ...
30s源码刨析系列之函数篇
前言由浅入深.逐个击破 30SecondsOfCode 中函数系列所有源码片段,带你领略源码之美. 本系列是对名库 30SecondsOfCode 的深入刨析. 本篇是其中的函数篇,可以在极短的时间 ...
MapReduce源码刨析
MapReduce编程刨析: Map map函数是对一些独立元素组成的概念列表(如单词计数中每行数据形成的列表)的每一个元素进行指定的操作(如把每行数据拆分成不同单词,并把每个单词计数为1),用户可以 ...
java源码解析之String类(一)
String是我们接触最多的类,无论是学习中还是工作中,基本每天都会和字符串打交道,从字符串本身的各种拼接.切片.变形,再到和其他基本数据类型的转换,几乎无时无刻都在使用它,今天就让我们揭开Strin ...
ConcurrentHashMap源码刨析（基于jdk1.7）
看源码前我们必须先知道一下ConcurrentHashMap的基本结构.ConcurrentHashMap是采用分段锁来进行并发控制的. 其中有一个内部类为Segment类用来表示锁.而Segment ...
java源码解析之String类(二)
上一节主要介绍了String类的一些构造方法,主要分为四类无参构造器:String(),创建一个空字符串"",区别于null字符串,""已经初始化,null并 ...
HashMap源码刨析（面试必看）
目录 1.Hash的计算规则? 2.HashMap是怎么形成环形链表的(即为什么不是线程安全)?(1.7中的问题) 3.JDK1.7和1.8的HashMap不同点? 4.HashMap和HashTab ...
Flask上下文管理及源码刨析
基本流程概述 - 与django相比是两种不同的实现方式. - django/tornado是通过传参数形式实现 - 而flask是通过上下文管理, 两种都可以实现,只不实现的方式不一样罢了. - 上 ...

随机推荐

【c#】Visual Studio 的下载及安装
“工欲善其事,必先利其器” 这篇博文我们介绍一下如何正确的安装基于c#使用的vs 2017. 1.首先在官网下载Visual Studio,下载地址:https://www.visualstudio. ...
手机端页面访问PC页面自动跳手机端代码
<script> var mobileAgent = new Array("iphone", "ipod", "ipad", & ...
[C#] 使 ToolTip 一直显示（在 WinForm 与 WPF 中的差异解决方案）
需求自己绘制的UI,检测鼠标位置,适时显示出 ToolTip 1 WinForm 的 ToolTip // Member define: private ToolTip _toolTip = new ...
(一)DAO设计及BaseDAO和BookDAO的实现
1.总体架构 MVC 设计模式:Model:POJO(Plain Old Java Object) Controller:ServletView:JSP + EL + JSTL 2.技术选型数据库: ...
画出决策边界线--plot_2d_separator.py源代码【来自python机器学习基础教程】
import numpy as np import matplotlib.pyplot as plt from .plot_helpers import cm2, cm3, discrete_scat ...
相邻元素margin的自动合并与float的坑
css中相邻元素的margin其实是会自动合并的,且取较大值. <!DOCTYPE html> <html lang="en"> <head> ...
Beta冲刺——5.26
这个作业属于哪个课程软件工程这个作业要求在哪里 Beta冲刺这个作业的目标 Beta冲刺作业正文正文 github链接项目地址其他参考文献无一.会议内容 1.组员一起学习Git分支管 ...
【zookeeper】安装教程文档需下载
请查看文件https://download.csdn.net/download/qq_42158942/11846847 zookeeper的作用 • ZooKeeper 是一个开源的分布式协调服务, ...
ecilpse 纠错插件
在market里面搜索 Spot Bugs Unnecessary Code Detector
JAVA实现对称加密
个人博客网:https://wushaopei.github.io/ (你想要这里多有) 一.对称加密算法DES 1.概述:采用单钥密码系统的加密方法,同一个密钥可以同时用作信息的加密和解密,这 ...

Java 源码刨析 - String

Java 源码刨析 - String的更多相关文章

随机推荐

热门专题