java源码解析之String类(一)

　　String是我们接触最多的类，无论是学习中还是工作中，基本每天都会和字符串打交道，从字符串本身的各种拼接、切片、变形，再到和其他基本数据类型的转换，几乎无时无刻都在使用它，今天就让我们揭开String神秘的面纱，这一小节主要讲解String的源代码是怎么构建的，下一节是String的一些疑点难点，通常在面试中会被问到。

　　在学习String之前，让我们先简单的看一下JVM的内存模型，附图一张，来自百度百科：

在java的每一个通过编译生成字节码文件后，运行期JVM将字节码文件（也就是class文件）的对象通过类加载器加载到JVM运行区，如上图，通过线程独享和共享分为俩部分，其中线程共享区包括方法区和java堆，线程独享区包括虚拟机栈、本地方法栈和程序计数器

我们常说的基本类型在栈中，引用类型在堆中，其中的堆就是java堆（线程共享），栈就是虚拟机栈（线程独享），而String还涉及到方法区，因为String对象是常量，因为String其实就是char数组，而这个数组被final修饰了，详情在源代码中。

/*

 *

 * 在java程序中，所有字符串文字都是String的实例，字符串是不变的; 它们的值在创建后无法更改。

 * 字符串缓冲区（StringBuffer和StringBuild）支持可变字符串。因为String对象是不可变的，所以它们可以共享。

 * 例如：

 * String str =“abc”;

 * 相当于：

 * char data [] = {'a'，'b'，'c'};

 * String str = new String（data）;

 * String对象并不是简单的存在于堆内存中，而是在方法区的常量池中，我会在下一节详细讲解

 *

 */

public final class String implements java.io.Serializable, Comparable<String>, CharSequence {

    /*

     * 该值用于字符存储。到这里就为什么String字符串会在常量池中我想大家一定豁然开朗了，因为final修饰的就是常量，而且不可修改，也就是说当我们定义一个

     * String a = "gaoxiaolong"

     * 从你的程序开始跑到最后结束运行，这个"gaoxiaolong"都一直存在，当然如果被当成垃圾回收那就另当别论了。而我们可以改变的仅仅是这个String的引用a的指向:

     * a = "gollong",这是a的指向变了，但是"gaoxiaolong"仍然在常量池中，如果再有一个b引用，String b = "gaoxiaolong",这时这个"gaoxiaolong"

     * 就不用再生成了，因为已经存在了。当然如果在这期间"gaoxiaolong"已经被回收就不是这么一回事了。

     */

    private final char value[];

    /*

     * 缓存字符串的哈希码，默认为0

     */

    private int hash; 

    /*

     * 实现Serializable（序列化）接口生成的序列化UID，用于序列化和反序列化识别此对象是String对象， 我会用一章来讲解序列化和反序列化

     */

    private static final long serialVersionUID = -6849794470754667710L;

    /*

     * Java.io.ObjectStreamField类是可序列化字段来自Serializable类的描述。 ObjectStreamFields数组用来声明一个类的序列化字段。

     * 在序列化和反序列化中详细详细讲解

     */

    private static final ObjectStreamField[] serialPersistentFields = new ObjectStreamField[0];

    /*

     * 初始化新创建的String对象，使其表示空字符序列。 请注意，由于字符串是不可变的，因此不必使用此构造函数。

     */

    public String() {

        this.value = "".value;

    }

    /*

     * 初始化新创建的String对象，使其表示与参数相同的字符序列;

     * 换句话说，新创建的字符串是参数字符串的副本。 除非需要original的明确副本，否则不必使用此构造函数，因为字符串是不可变的。

     * 可见官方极力推崇String a = "gaoxiaolong"的写法，这种构造器仅仅是创建一个副本。其实这个副本是在堆内存中的一个引用指向方法区中的真正的"gaoxiaolong"

     * 他们还是同一个"gaoxiaolong",只不过栈当中的地址值不同罢了

     */

    public String(String original) {

        this.value = original.value;

        this.hash = original.hash;

    }

    /*

     * 比较常用的一种构造方法，可以把一个字符数组转化为字符串，其实就是将这个字符数组赋值给当前引用的char[] value属性

     * 分配新的String，使其表示当前包含在字符数组参数中的字符序列。 复制字符数组的内容; 后续修改字符数组不会影响新创建的字符串。

     *    内部调用   Arrays工具类中的copyOf方法

     */

    public String(char value[]) {

        this.value = Arrays.copyOf(value, value.length);

    }

    /*

     * 这个构造器看源码我们可以看到将char数组直接赋值给当前对象的value属性，区别于上一个构造器，上一个是完全复制一份数组，

     * 相互之间不影响，而这个是俩个引用指向同一个数组，一个被改变另一个也会被改变。

     * 但是这个构造器的访问权限是包访问权限，所以我们无法使用。不必纠结

     */

    String(char[] value, boolean share) {

        // assert share : "unshared not supported";

        this.value = value;

    }

    /*

     * 分配一个新的String，其中包含字符数组参数的子数组中的字符。offset参数是子数组的第一个字符的索引，

     * count参数指定子数组的长度。 复制子阵列的内容; 后续修改字符数组不会影响新创建的字符串。

     * 从源码中我们可以看出一种特殊情况：如果count = 0且offset <= value.length那么实际上就是一个空字符串

     * 这里一定要记住，第三个参数是个数，也就是长度，千万不要记成结束位置，切记切记！

     * 这一点比较特殊，在字符串构造器中，都是offset和count参数，而在切片函数substring(int beginIndex, int endIndex)中

     * 所需要的参数却是开始位置和结束位置，一定不要记混了。

     */

    public String(char value[], int offset, int count) {

        if (offset < 0) {

            throw new StringIndexOutOfBoundsException(offset);

        }

        if (count <= 0) {

            if (count < 0) {

                throw new StringIndexOutOfBoundsException(count);

            }

            if (offset <= value.length) {

                this.value = "".value;

                return;

            }

        }

        // 如果offset+count的值超过的数组的长度自然报错，如果错误信息返回的是offset+count的值，则是这个错误。

        if (offset > value.length - count) {

            throw new StringIndexOutOfBoundsException(offset + count);

        }

        this.value = Arrays.copyOfRange(value, offset, offset + count);

    }

    /*

     *

     */

    public String(int[] codePoints, int offset, int count) {

        if (offset < 0) {

            throw new StringIndexOutOfBoundsException(offset);

        }

        if (count <= 0) {

            if (count < 0) {

                throw new StringIndexOutOfBoundsException(count);

            }

            if (offset <= codePoints.length) {

                this.value = "".value;

                return;

            }

        }

        if (offset > codePoints.length - count) {

            throw new StringIndexOutOfBoundsException(offset + count);

        }

        final int end = offset + count;

        // Pass 1: Compute precise size of char[]

        int n = count;

        for (int i = offset; i < end; i++) {

            int c = codePoints[i];

            if (Character.isBmpCodePoint(c))

                continue;

            else if (Character.isValidCodePoint(c))

                n++;

            else

                throw new IllegalArgumentException(Integer.toString(c));

        }

        // Pass 2: Allocate and fill in char[]

        final char[] v = new char[n];

        for (int i = offset, j = 0; i < end; i++, j++) {

            int c = codePoints[i];

            if (Character.isBmpCodePoint(c))

                v[j] = (char) c;

            else

                Character.toSurrogates(c, v, j++);

        }

        this.value = v;

    }

    /*

     * 检查边界的一个函数，在上面将字符数组转换为String对象时，我们见过了函数内的边界判断，由于关于字节的构造器过多，所以讲反复重用的代码封装成一个函数

     * 到时候直接调用即可，这就是面向对象中封装的思想。

     */

    private static void checkBounds(byte[] bytes, int offset, int length) {

        if (length < 0)

            throw new StringIndexOutOfBoundsException(length);

        if (offset < 0)

            throw new StringIndexOutOfBoundsException(offset);

        if (offset > bytes.length - length)

            throw new StringIndexOutOfBoundsException(offset + length);

    }

    /*

     *

     */

    @Deprecated

    public String(byte ascii[], int hibyte) {

        this(ascii, hibyte, 0, ascii.length);

    }

    /*

     * @Deprecated注解表示此方法已经过时，但仍然可以使用，只是不推荐

     * ascii为要转换为字符的字节数组，hibyte为每个16位Unicode代码单元的前8位

     * java使用的是Unicode编码表，每个字符都占俩个字节，但是一个字节只是一个字节，所以此方法在转换的时候

     * 想指定另一个字节的数据来达到不同的需求，但是往往是不正确的转换，而使用指定charset完全可以达到此目的。

     */

    @Deprecated

    public String(byte ascii[], int hibyte, int offset, int count) {

        checkBounds(ascii, offset, count);

        char value[] = new char[count];

        if (hibyte == 0) {

            for (int i = count; i-- > 0;) {

                value[i] = (char) (ascii[i + offset] & 0xff);

            }

        } else {

            hibyte <<= 8;

            for (int i = count; i-- > 0;) {

                value[i] = (char) (hibyte | (ascii[i + offset] & 0xff));

            }

        }

        this.value = value;

    }

    /*

     * 下面的都是讲字节数组转换为字符串的构造器，也是方法的重载，为了适应不用的转换需求，不许参数为字节数组，

     * 可变参数为开始位置offset，转换长度length,指定编码方式charset，其中charset有俩种指定方式，一种是出入String类型的charsetName

     * 另一种是传入Charset类型的charset，如果不知道的话，offset默认为0，length默认为字节数组的长度。chatset默认为本地编码

     */

    public String(byte bytes[]) {

        this(bytes, 0, bytes.length);

    }

    /*

     *

     */

    public String(byte bytes[], int offset, int length, String charsetName) throws UnsupportedEncodingException {

        if (charsetName == null)

            throw new NullPointerException("charsetName");

        checkBounds(bytes, offset, length);

        this.value = StringCoding.decode(charsetName, bytes, offset, length);

    }

    /*

     *

     */

    public String(byte bytes[], int offset, int length, Charset charset) {

        if (charset == null)

            throw new NullPointerException("charset");

        checkBounds(bytes, offset, length);

        this.value = StringCoding.decode(charset, bytes, offset, length);

    }

    /*

     */

    public String(byte bytes[], String charsetName) throws UnsupportedEncodingException {

        this(bytes, 0, bytes.length, charsetName);

    }

    /*

     *

     */

    public String(byte bytes[], Charset charset) {

        this(bytes, 0, bytes.length, charset);

    }

    /*

     * 将字节数组转换为字符串，指定开始位置和长度。

     */

    public String(byte bytes[], int offset, int length) {

        checkBounds(bytes, offset, length);

        this.value = StringCoding.decode(bytes, offset, length);

    }

    /*

     * 将字符串缓冲区对象转换成String对象，实际上就是将一个堆内存中的对象写入常量池中，

     * 使用Arrays.copyOf复制，得到的是俩份完全独立的数组

     * StringBuilder是线程不安全的，效率高

     * StringBuffer是线程安全的，但代价就是效率低，效率低是相比于StringBuilder，它仍然比String快很多

     */

    public String(StringBuffer buffer) {

        synchronized (buffer) {

            this.value = Arrays.copyOf(buffer.getValue(), buffer.length());

        }

    }

    public String(StringBuilder builder) {

        this.value = Arrays.copyOf(builder.getValue(), builder.length());

    }

}

java源码解析之String类(一)的更多相关文章

java源码解析之String类(三)
上一节我们主要讲了String类的一些不是很常用的方法,其中需要掌握的如下,我就不再赘述了 public int length() public boolean isEmpty() public by ...
java源码解析之String类(二)
上一节主要介绍了String类的一些构造方法,主要分为四类无参构造器:String(),创建一个空字符串"",区别于null字符串,""已经初始化,null并 ...
java源码解析之String类(四)
/* * 返回指定字符第一次出现的字符串内的索引 */ public int indexOf(int ch) { return indexOf(ch, 0); } /* * 返回指定字符第一次出现的字 ...
java源码解析之String类(五)
/* * 切片函数,非常重要,这里一定要牢记beginIndex是开始位置,endIndex是结束位置,区别于以前学的offset是开始位置,而count或length是个数和长度 * 比如说,new ...
java源码解析之Object类
一.Object类概述 Object类是java中类层次的根,是所有类的基类.在编译时会自动导入.Object中的方法如下: 二.方法详解 Object的方法可以分成两类,一类是被关键字fin ...
[Java源码解析] -- String类的compareTo(String otherString)方法的源码解析
String类下的compareTo(String otherString)方法的源码解析一. 前言近日研究了一下String类的一些方法, 通过查看源码, 对一些常用的方法也有了更透彻的认识, ...
【Java源码解析】Thread
简介线程本质上也是进程.线程机制提供了在同一程序内共享内存地址空间运行的一组线程.对于内核来讲,它就是进程,只是该进程和其他一下进程共享某些资源,比如地址空间.在Java语言里,Thread类封装了 ...
AOP源码解析：AspectJAwareAdvisorAutoProxyCreator类的介绍
AspectJAwareAdvisorAutoProxyCreator 的类图上图中一些类/接口的介绍: AspectJAwareAdvisorAutoProxyCreator : 公开了Asp ...
[java源码解析]对HashMap源码的分析（二）
上文我们讲了HashMap那骚骚的逻辑结构,这一篇我们来吹吹它的实现思想,也就是算法层面.有兴趣看下或者回顾上一篇HashMap逻辑层面的,可以看下HashMap源码解析(一).使用了哈希表得“拉链法 ...

随机推荐

动态加载Layout
因为现在手头上做的需要显示很多不同布局,想着拆分开来不要全部都写到main.xml里,于是就想到动态加载Layout 目前试了下, LinearLayout page = (LinearLayout) ...
WPF中动态加载XAML中的控件
原文:WPF中动态加载XAML中的控件 using System; using System.Collections.Generic; using System.Linq; using System. ...
论题Cascade Object Detection with Deformable Part Models一个怀疑
该文的作者是Pedro F. Felzenszwalb等一下,著名DPM在目标检测模型.本文的工作是DPM(变形组件模型)级联,以加快检测速度. 加速的方式,现在其次是计算总结成绩的某些部分,假设小于 ...
uwp - ContentDialog - 自定义仿iphone提示框，提示框美化
原文:uwp - ContentDialog - 自定义仿iphone提示框,提示框美化为了实现我想要的效果花费了我很长时间,唉,当初英语不好好学,翻官网翻了半天才找到,分享给刚入门的新手. 首先看 ...
VS2005下如何安装配置编译Qt4.6
本文将使用简单的几个步骤说明在VC 2005下如何编译安装并开发Qt4.6应用程序,其实大部分方法和Qt4.6.0是一样的,不过Qt4.6.0集成了Qt Creater,目录的形式有点改变了,现在我就 ...
Oracle 一些实用的DBA语句
--查询LOB的大小和所在表空间 SELECT A.TABLE_NAME, A.COLUMN_NAME, B.SEGMENT_NAME, B.SEGMENT_TYPE, B.TABLESPACE_NA ...
[视频]产品营销之拍出好电子产品，Peter Belanger是如何为苹果产品拍照的
Peter Belanger –他就是那些颠覆你想象的苹果产品照片的摄影师.作为旧金山的顶级产品图片设计师的 Peter,他还拥有 eBay, Nike, Pixer 和 Square 等客户. 让我 ...
关于JSON 字段数据的直接查询
最新的pgSQL 对json的支持在进一步加强!虽然我也学了那么点皮毛,但是json数据对于WEB的开发确实很重要,苦苦学习了很长一段时间,不断的关系PGSQL的动向! 好在翻看很多高人的例子和介绍, ...
ASP .NET　Model
Model是全局变量,一个页面一个前台 @ModelWebApplication1.Models.Movie; @{ ViewBag.Title = "ModelTest"; } ...
iPhone开发笔记（20）EGOImageView的使用方法及注意事项
EGOImageView是一种实现网络图片的异步加载和缓存的第三方类库,具有相同功能的第三方类库还有SDWebImage.但是相比两个类库的安装和使用来说,EGOImageView更简单一些,下面就介 ...

java源码解析之String类(一)

java源码解析之String类(一)的更多相关文章

随机推荐

热门专题