JDK源码阅读:String类阅读笔记
String
public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence,
               Constable, ConstantDesc {
	...
}
1. value数组
用于存储String的字符。
@Stable
private final byte[] value;
@Stable注解表示变量最多被修改一次,称为“稳定的”。
2. checkBoundsOffCount和checkBoundsBeginEnd方法
String的很多构造方法使用了数组或者其他一些集合来创建新的String,这些构造方法大多含有以下参数
- 集合S
- 取值左端点p
- 取值长度l
那么需要一个方法来检查这几个参数是否合法,所以String类提供了checkBoundsOffCount()方法
static void checkBoundsOffCount(int offset, int count, int length) {
    if (offset < 0 || count < 0 || offset > length - count) {
        throw new StringIndexOutOfBoundsException(
            "offset " + offset + ", count " + count + ", length " + length);
    }
}
如下是一个以bytes数组初始化String的例子,使用了上述方法。
public String(byte bytes[], int offset, int length, String charsetName)
            throws UnsupportedEncodingException {
    if (charsetName == null)
        throw new NullPointerException("charsetName");
    // 检查参数边界合法性
    checkBoundsOffCount(offset, length, bytes.length);
    StringCoding.Result ret =
        StringCoding.decode(charsetName, bytes, offset, length);
    this.value = ret.value;
    this.coder = ret.coder;
}
同时,还有一个checkBoundsBeginEnd()方法
static void checkBoundsBeginEnd(int begin, int end, int length) {
    if (begin < 0 || begin > end || end > length) {
        throw new StringIndexOutOfBoundsException(
            "begin " + begin + ", end " + end + ", length " + length);
    }
}
这个方法可以检查begin、end以及length是否适配
3. COMPACT_STRINGS常量
static final boolean COMPACT_STRINGS;
static {
    COMPACT_STRINGS = true;
}
这个常量用于表示是否支持字符串压缩,默认为true。
在coder()方法内,要求返回String的编码,它是这样实现的。
byte coder(){
    return COMPACT_STRINGS ? coder : UTF16;
}
如果支持字符串压缩,就正常返回该字符串的coder,否则必须使用UTF16。
4. length方法
public int length() {
    return value.length >> coder();
}
获取value的长度,再根据字符集进行处理。
coder()的返回结果如LATIN1、UTF16等都是字节常量。
@Native static final byte LATIN1 = 0;
@Native static final byte UTF16  = 1;
5. getChars方法
public void getChars(int srcBegin, int srcEnd, char dst[], int dstBegin)
这个方法可以将String中的一部分转化字符存到chars数组中。下面是一个简单的使用示例。
public static void main(String[] args) {
    String s = "abc";
    char[] cs = new char[50];
    s.getChars(0,2,cs,0);
    System.out.println(cs);
}
输出
ab
6. comepareTo方法
public int compareTo(String anotherString) {
    byte v1[] = value;
    byte v2[] = anotherString.value;
    byte coder = coder();
    if (coder == anotherString.coder()) {
        return coder == LATIN1 ? StringLatin1.compareTo(v1, v2)
            : StringUTF16.compareTo(v1, v2);
    }
    return coder == LATIN1 ? StringLatin1.compareToUTF16(v1, v2)
        : StringUTF16.compareToLatin1(v1, v2);
}
当调用String的compareTo方法时,会根据字符串的编码类型选择不同类的静态方法。而它们内部实现compare的算法都是类似的。下面给出一个例子。
// StringLating类
public static int compareTo(byte[] value, byte[] other, int len1, int len2) {
    int lim = Math.min(len1, len2);
    for (int k = 0; k < lim; k++) {
        if (value[k] != other[k]) {
            return getChar(value, k) - getChar(other, k);
        }
    }
    return len1 - len2;
}
7. hashCode方法
String的哈希方法采用这个公式:$s[0]31^{(n-1)} + s[1]31^{(n-2)} + \cdots + s[n-1]$
public int hashCode() {
    int h = hash;
    if (h == 0 && !hashIsZero) {
        h = isLatin1() ? StringLatin1.hashCode(value)
            : StringUTF16.hashCode(value);
        if (h == 0) {
            hashIsZero = true;
        } else {
            hash = h;
        }
    }
    return h;
}
下面是StringLatin.hashCode()
public static int hashCode(byte[] value) {
    int h = 0;
    for (byte v : value) {
        h = 31 * h + (v & 0xff);
    }
    return h;
}
8. replaceAll和replaceFirst方法
public String replaceAll(String regex, String replacement) {
    return Pattern.compile(regex).matcher(this).replaceAll(replacement);
}
public String replaceFirst(String regex, String replacement) {
    // 用regex表示的正则表达式去匹配当前字符串,再调用Matcher.replace
    return Pattern.compile(regex).matcher(this).replaceFirst(replacement);
}
replaceAll()和replaceFirst()方法接受regex参数和replacement参数。Pattern类从调用compile()方法解析正则表达式regex返回一个Mathcher,再调用它的replaceAll()或replaceFirst()方法。
9. LATIN1和UTF16
String类中定义了LATIN1和UTF16两个编码格式
@Native static final byte LATIN1 = 0;
@Native static final byte UTF16  = 1;
- ISO Latin-1是8比特的字符集,定义了256个字符。前128个字符(00000000-01111111)与ASCII完全一致。
- 所以使用LATIN1作为编码格式时,往往要通过&0xff的方式取低八位
 
- 所以使用LATIN1作为编码格式时,往往要通过
- UTF-16也是采用可变长度编码,可以是一个或者两个16比特。
JDK源码阅读:String类阅读笔记的更多相关文章
- JDK源码之String类解析
		一 概述 String由final修饰,是不可变类,即String对象也是不可变对象.这意味着当修改一个String对象的内容时,JVM不会改变原来的对象,而是生成一个新的String对象 主要考虑以 ... 
- jdk源码理解-String类
		String类的理解 简记录一下对于jdk的学习,做一下记录,会持续补充,不断学习,加油 1.String的hash值的计算方法. hash值的计算方法多种多样,jdk中String的计算方法如下,比 ... 
- JDK源码学习--String篇(二) 关于String采用final修饰的思考
		JDK源码学习String篇中,有一处错误,String类用final[不能被改变的]修饰,而我却写成静态的,感谢CTO-淼淼的指正. 风一样的码农提出的String为何采用final的设计,阅读JD ... 
- JDK源码之Integer类分析
		一 简介 Integer是int基本类型的包装类,同样继承了Number类,实现了Comparable接口,String类中的一些转化方法就使用了Integer类中的一些API,且fianl修饰不可继 ... 
- 源码学习-String类
		最近在扫描CodeDex时报了一个不能使用String.intern()的字符串来做锁对象的告警,对这个问题有疑问查了些资料,顺便学习一下String类的源码. 1.类定义 String 被final ... 
- JDK源码之Double类&Float类分析
		一 概述 Double 类是基本类型double的包装类,fainl修饰,在对象中包装了一个基本类型double的值.Double继承了Number抽象类,具有了转化为基本double类型的功能. 此 ... 
- JDK源码学习--String篇(四) 终结篇
		StringBuilder和StringBuffer 前面讲到String是不可变的,如果需要可变的字符串将如何使用和操作呢?JAVA提供了连个操作可变字符串的类,StringBuilder和Stri ... 
- JDK源码学习--String篇(三) 存储篇
		在进一步解读String类时,先了解下内存分配和数据存储的. 数据存储 1.寄存器:最快的存储区,位于处理器的内部.由于寄存器的数量有限,所以寄存器是按需分配. 2.堆栈:位于RAM中,但是通过堆栈指 ... 
- JDK源码学习--String篇(-)
		工作三年了,用了三年的JAVA,突然发现竟然没有好好的看下JDK的源码,整天用着的String,只是大概知道怎么回事,其中的实现逻辑却是一头雾水. 知耻而后勇,加油!!! java.lang.Stri ... 
- [Java源码解析] -- String类的compareTo(String otherString)方法的源码解析
		String类下的compareTo(String otherString)方法的源码解析 一. 前言 近日研究了一下String类的一些方法, 通过查看源码, 对一些常用的方法也有了更透彻的认识, ... 
随机推荐
- 【java虚拟机】内存溢出解决思路
			转自:https://blog.csdn.net/u013521220/article/details/79523633 内存溢出与数据库锁表的问题,可以说是开发人员的噩梦,一般的程序异常,总是可以知 ... 
- 初探Spring Security
			Spring Security 简介 Spring Security是Spring家族中的一个组成框架,具有强大且高度可定制的身份验证和访问控制功能,致力于为Java应用程序提供身份的验证和授权 (先 ... 
- 眼见为实,看看MySQL中的隐藏列!
			在介绍mysql的多版本并发控制mvcc的过程中,我们提到过mysql中存在一些隐藏列,例如行标识.事务ID.回滚指针等,不知道大家是否和我一样好奇过,要怎样才能实际地看到这些隐藏列的值呢? 本文我们 ... 
- n个容器取油问题再探
			在 韩信分油问题的拓展分析 里,最后给出了一般性的结论,即: 用 n (n > 1) 个不规则无刻度的容器从一个无穷大的油桶里取油,这些容器容量都为整数升,分别记为 a1, a2, ..., a ... 
- AWS EC2 实例 SSH 无法登录故障
			文章链接 故障表现 在使用 jumperver 登录 AWS ec2 实例的时候发现 ssh 配合秘钥登录的时候无法登录, 具体报错如下: ssh -i /path/xx.pem user@10.0. ... 
- GDAL 矢量裁剪栅格
			本节将介绍如何在Python中用GDAL实现根据矢量边界裁剪栅格数据. from osgeo import gdal, gdal_array import shapefile import numpy ... 
- 浅析mybatis中${}和#{}取值区别
			mybatis作为一个轻量级的ORM框架,应用广泛,其上手使用也比较简单:一个成熟的框架,必然有精巧的设计,值得学习. 在使用mybatis框架时,在sql语句中获取传入的参数有如下两种方式: ${p ... 
- 模板引挚 jade  ejs
			// asl sum翡翠 后台使用如下: const jade = require('jade') //pretty 美化的意思,指的是渲染的布局会美化 2020-2-15 var str = j ... 
- 迷宫3---BFS
			经过思考蒜头君终于解决了怎么计算一个迷宫的最短路问题,于是蒜头君找到一个新的迷宫图,来验证自己是否真的会计算一个迷宫的最短路. 为了检验自己计算的是否正确,蒜头君特邀你一起来计算. 输入格式 第一行输 ... 
- 一、java基础补充
			1.java执行流程 源文件由编译器编译成字节码(ByteCode),也就是.class文件 字节码由java虚拟机解释运行 通过命令行操作java程序: javac test.java java t ... 
