Java源码赏析（五）再识 String 类

在 Java源码赏析（三）初识 String 类中，我们已经大概理解了String的接口，接下来我们描述一下String的常用工具方法。

/**

 * 为了精简的String结构，之前提到的方法省略，重点介绍剩余的方法（省略构造方法、indexOf、lastIndexOf、valueOf）

 */

public final class String

    implements java.io.Serializable, Comparable<String>, CharSequence {

    private final char value[];

    private int hash; // Default to 0

    private static final long serialVersionUID =         -6849794470754667710L;

    /** 指明需要实例化的字段 */

    private static final ObjectStreamField[] serialPersistentFields =

        new ObjectStreamField[0];

    /** 省略CaseInsensitiveComparator()的实现，主要是用于按ASCII码的排序规则进行排序 */

    public static final Comparator<String> CASE_INSENSITIVE_ORDER

                                         = new CaseInsensitiveComparator();

    /** 实现Comparable<String> */

    public int compareTo(String anotherString) {

        ...

    }

    /** 覆盖hashCode() */

    public int hashCode() {

        ...

    }

    /** 覆盖父类equal() */

    public boolean equals(Object anObject) {

        ...

    }

    /** 覆盖父类toString() */

    public String toString() {

        return this;

    }

    /**

     *   实现CharSequence接口

     *   共有length(), charAt(int index), subSequence(int beginIndex, int endIndex) 等

     *   在实现subSequence()方法时使用了String中substring()方法

     */

    /** 获取字符串长度 */

    public int length() {

        return value.length;

    }

    /** 获取index位置的字符 */

    public char charAt(int index) {

    ...

    }

    /** 获取子字符序列 */

    public CharSequence subSequence(int beginIndex, int endIndex) {

        return this.substring(beginIndex, endIndex);

    }

    /** 获取子串 */

    public String substring(int beginIndex, int endIndex) {

    ...

    }

    /** 将字符串存入常量池并返回在常量池的引用 */

    public native String intern();

    /**分隔线*/

　　将字符串str连接至末尾，创建一个新字符串*/

    public String concat(String str) {

        int otherLen = str.length();

        if (otherLen == 0) {

            return this;

        }

        int len = value.length;

        char buf[] = Arrays.copyOf(value, len + otherLen);

        str.getChars(buf, len);

        return new String(buf, true);

    }

    /** 将oldChar字符替换为newChar字符*/

    public String replace(char oldChar, char newChar) {

        if (oldChar != newChar) {

            int len = value.length;

            int i = -1;

            char[] val = value; /* avoid getfield opcode */

            while (++i < len) {

                if (val[i] == oldChar) {

                    break;

                }

            }

            if (i < len) {

                char buf[] = new char[len];

                for (int j = 0; j < i; j++) {

                    buf[j] = val[j];

                }

                while (i < len) {

                    char c = val[i];

                    buf[i] = (c == oldChar) ? newChar : c;

                    i++;

                }

                return new String(buf, true);

            }

        }

        return this;

    }

    /** 返回是否被regex匹配*/

    public boolean matches(String regex) {

        return Pattern.matches(regex, this);

    }

    /** 查看字符串s是否被包含*/

    public boolean contains(CharSequence s) {

        return indexOf(s.toString()) > -1;

    }

    /** 替换第一个根据regex匹配到的字符串为replacement*/

    public String replaceFirst(String regex, String replacement) {

        return Pattern.compile(regex).matcher(this).replaceFirst(replacement);

    }

    /** 将regex匹配到的内容全部替换为replacement*/

    public String replaceAll(String regex, String replacement) {

        return Pattern.compile(regex).matcher(this).replaceAll(replacement);

    }

    /** 将字符串target替换为replacement*/

    public String replace(CharSequence target, CharSequence replacement) {

        return Pattern.compile(target.toString(), Pattern.LITERAL).matcher(

                this).replaceAll(Matcher.quoteReplacement(replacement.toString()));

    }

    /** 根据regex分割limit次字符串*/

    public String[] split(String regex, int limit) {

        /* fastpath if the regex is a

         (1)one-char String and this character is not one of the

            RegEx's meta characters ".$|()[{^?*+\\", or

         (2)two-char String and the first char is the backslash and

            the second is not the ascii digit or ascii letter.

         */

        char ch = 0;

        if (((regex.value.length == 1 &&

             ".$|()[{^?*+\\".indexOf(ch = regex.charAt(0)) == -1) ||

             (regex.length() == 2 &&

              regex.charAt(0) == '\\' &&

              (((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 &&

              ((ch-'a')|('z'-ch)) < 0 &&

              ((ch-'A')|('Z'-ch)) < 0)) &&

            (ch < Character.MIN_HIGH_SURROGATE ||

             ch > Character.MAX_LOW_SURROGATE))

        {

            int off = 0;

            int next = 0;

            boolean limited = limit > 0;

            ArrayList<String> list = new ArrayList<>();

            while ((next = indexOf(ch, off)) != -1) {

                if (!limited || list.size() < limit - 1) {

                    list.add(substring(off, next));

                    off = next + 1;

                } else {    // last one

                    //assert (list.size() == limit - 1);

                    list.add(substring(off, value.length));

                    off = value.length;

                    break;

                }

            }

            // If no match was found, return this

            if (off == 0)

                return new String[]{this};

            // Add remaining segment

            if (!limited || list.size() < limit)

                list.add(substring(off, value.length));

            // Construct result

            int resultSize = list.size();

            if (limit == 0) {

                while (resultSize > 0 && list.get(resultSize - 1).length() == 0) {

                    resultSize--;

                }

            }

            String[] result = new String[resultSize];

            return list.subList(0, resultSize).toArray(result);

        }

        return Pattern.compile(regex).split(this, limit);

    }

    /** 根据regex分隔字符串*/

    public String[] split(String regex) {

        return split(regex, 0);

    }

    /** 将elements字符串数组中插入delimiter字符串 比如 String.join(",", {"a", "b", "c"})  == "a,b,c" */

    public static String join(CharSequence delimiter, CharSequence... elements) {

        Objects.requireNonNull(delimiter);

        Objects.requireNonNull(elements);

        // Number of elements not likely worth Arrays.stream overhead.

        StringJoiner joiner = new StringJoiner(delimiter);

        for (CharSequence cs: elements) {

            joiner.add(cs);

        }

        return joiner.toString();

    }

    /** 同上，数组改为了集合*/

    public static String join(CharSequence delimiter,

            Iterable<? extends CharSequence> elements) {

        Objects.requireNonNull(delimiter);

        Objects.requireNonNull(elements);

        StringJoiner joiner = new StringJoiner(delimiter);

        for (CharSequence cs: elements) {

            joiner.add(cs);

        }

        return joiner.toString();

    }

    /** 全部转化为小写字母*/

    public String toLowerCase(Locale locale) {

        if (locale == null) {

            throw new NullPointerException();

        }

        int firstUpper;

        final int len = value.length;

        /* Now check if there are any characters that need to be changed. */

        scan: {

            for (firstUpper = 0 ; firstUpper < len; ) {

                char c = value[firstUpper];

                if ((c >= Character.MIN_HIGH_SURROGATE)

                        && (c <= Character.MAX_HIGH_SURROGATE)) {

                    int supplChar = codePointAt(firstUpper);

                    if (supplChar != Character.toLowerCase(supplChar)) {

                        break scan;

                    }

                    firstUpper += Character.charCount(supplChar);

                } else {

                    if (c != Character.toLowerCase(c)) {

                        break scan;

                    }

                    firstUpper++;

                }

            }

            return this;

        }

        char[] result = new char[len];

        int resultOffset = 0;  /* result may grow, so i+resultOffset

                                * is the write location in result */

        /* Just copy the first few lowerCase characters. */

        System.arraycopy(value, 0, result, 0, firstUpper);

        String lang = locale.getLanguage();

        boolean localeDependent =

                (lang == "tr" || lang == "az" || lang == "lt");

        char[] lowerCharArray;

        int lowerChar;

        int srcChar;

        int srcCount;

        for (int i = firstUpper; i < len; i += srcCount) {

            srcChar = (int)value[i];

            if ((char)srcChar >= Character.MIN_HIGH_SURROGATE

                    && (char)srcChar <= Character.MAX_HIGH_SURROGATE) {

                srcChar = codePointAt(i);

                srcCount = Character.charCount(srcChar);

            } else {

                srcCount = 1;

            }

            if (localeDependent ||

                srcChar == '\u03A3' || // GREEK CAPITAL LETTER SIGMA

                srcChar == '\u0130') { // LATIN CAPITAL LETTER I WITH DOT ABOVE

                lowerChar = ConditionalSpecialCasing.toLowerCaseEx(this, i, locale);

            } else {

                lowerChar = Character.toLowerCase(srcChar);

            }

            if ((lowerChar == Character.ERROR)

                    || (lowerChar >= Character.MIN_SUPPLEMENTARY_CODE_POINT)) {

                if (lowerChar == Character.ERROR) {

                    lowerCharArray =

                            ConditionalSpecialCasing.toLowerCaseCharArray(this, i, locale);

                } else if (srcCount == 2) {

                    resultOffset += Character.toChars(lowerChar, result, i + resultOffset) - srcCount;

                    continue;

                } else {

                    lowerCharArray = Character.toChars(lowerChar);

                }

                /* Grow result if needed */

                int mapLen = lowerCharArray.length;

                if (mapLen > srcCount) {

                    char[] result2 = new char[result.length + mapLen - srcCount];

                    System.arraycopy(result, 0, result2, 0, i + resultOffset);

                    result = result2;

                }

                for (int x = 0; x < mapLen; ++x) {

                    result[i + resultOffset + x] = lowerCharArray[x];

                }

                resultOffset += (mapLen - srcCount);

            } else {

                result[i + resultOffset] = (char)lowerChar;

            }

        }

        return new String(result, 0, len + resultOffset);

    }

    /** 全部转化为小写字母*/

    public String toLowerCase() {

        return toLowerCase(Locale.getDefault());

    }

    /** 全部转化为大写字母*/

    public String toUpperCase(Locale locale) {

        if (locale == null) {

            throw new NullPointerException();

        }

        int firstLower;

        final int len = value.length;

        /* Now check if there are any characters that need to be changed. */

        scan: {

            for (firstLower = 0 ; firstLower < len; ) {

                int c = (int)value[firstLower];

                int srcCount;

                if ((c >= Character.MIN_HIGH_SURROGATE)

                        && (c <= Character.MAX_HIGH_SURROGATE)) {

                    c = codePointAt(firstLower);

                    srcCount = Character.charCount(c);

                } else {

                    srcCount = 1;

                }

                int upperCaseChar = Character.toUpperCaseEx(c);

                if ((upperCaseChar == Character.ERROR)

                        || (c != upperCaseChar)) {

                    break scan;

                }

                firstLower += srcCount;

            }

            return this;

        }

        /* result may grow, so i+resultOffset is the write location in result */

        int resultOffset = 0;

        char[] result = new char[len]; /* may grow */

        /* Just copy the first few upperCase characters. */

        System.arraycopy(value, 0, result, 0, firstLower);

        String lang = locale.getLanguage();

        boolean localeDependent =

                (lang == "tr" || lang == "az" || lang == "lt");

        char[] upperCharArray;

        int upperChar;

        int srcChar;

        int srcCount;

        for (int i = firstLower; i < len; i += srcCount) {

            srcChar = (int)value[i];

            if ((char)srcChar >= Character.MIN_HIGH_SURROGATE &&

                (char)srcChar <= Character.MAX_HIGH_SURROGATE) {

                srcChar = codePointAt(i);

                srcCount = Character.charCount(srcChar);

            } else {

                srcCount = 1;

            }

            if (localeDependent) {

                upperChar = ConditionalSpecialCasing.toUpperCaseEx(this, i, locale);

            } else {

                upperChar = Character.toUpperCaseEx(srcChar);

            }

            if ((upperChar == Character.ERROR)

                    || (upperChar >= Character.MIN_SUPPLEMENTARY_CODE_POINT)) {

                if (upperChar == Character.ERROR) {

                    if (localeDependent) {

                        upperCharArray =

                                ConditionalSpecialCasing.toUpperCaseCharArray(this, i, locale);

                    } else {

                        upperCharArray = Character.toUpperCaseCharArray(srcChar);

                    }

                } else if (srcCount == 2) {

                    resultOffset += Character.toChars(upperChar, result, i + resultOffset) - srcCount;

                    continue;

                } else {

                    upperCharArray = Character.toChars(upperChar);

                }

                /* Grow result if needed */

                int mapLen = upperCharArray.length;

                if (mapLen > srcCount) {

                    char[] result2 = new char[result.length + mapLen - srcCount];

                    System.arraycopy(result, 0, result2, 0, i + resultOffset);

                    result = result2;

                }

                for (int x = 0; x < mapLen; ++x) {

                    result[i + resultOffset + x] = upperCharArray[x];

                }

                resultOffset += (mapLen - srcCount);

            } else {

                result[i + resultOffset] = (char)upperChar;

            }

        }

        return new String(result, 0, len + resultOffset);

    }

    /** 全部转化为大写字母*/

    public String toUpperCase() {

        return toUpperCase(Locale.getDefault());

    }

    /** 去除字符串前后的空格*/

    public String trim() {

        int len = value.length;

        int st = 0;

        char[] val = value;    /* avoid getfield opcode */

        while ((st < len) && (val[st] <= ' ')) {

            st++;

        }

        while ((st < len) && (val[len - 1] <= ' ')) {

            len--;

        }

        return ((st > 0) || (len < value.length)) ? substring(st, len) : this;

    }

    /** 转化为字符数组*/

    public char[] toCharArray() {

        // Cannot use Arrays.copyOf because of class initialization order issues

        char result[] = new char[value.length];

        System.arraycopy(value, 0, result, 0, value.length);

        return result;

    }

    /** 格式化字符串，便于输出*/

    public static String format(String format, Object... args) {

        return new Formatter().format(format, args).toString();

    }

    /** 使用指定的地区l，格式化字符串，便于输出*/

    public static String format(Locale l, String format, Object... args) {

        return new Formatter(l).format(format, args).toString();

    }

    /** 根据data字符数组从offset开始复制count个字符*/

    public static String valueOf(char data[], int offset, int count) {

        return new String(data, offset, count);

    }

    /** 根据data字符数组从offset开始拷贝count个字符*/

    public static String copyValueOf(char data[], int offset, int count) {

        return new String(data, offset, count);

    }

    /** 拷贝字符串的值*/

    public static String copyValueOf(char data[]) {

        return new String(data);

    }

    /** 省略大部分的类型转化为字符串*/

    public static String valueOf(boolean b) {

        return b ? "true" : "false";

    }

    ...

}

未完，待续

Java源码赏析（五）再识 String 类的更多相关文章

Java源码赏析（一）Object 类
写这个系列的原因,其实网上已经有无数源码分析的文章了,多一篇不多,少一篇不少,但为什么还要写这部分文章呢?于私,其一,上班族已经很久没有打过完整的一整段有意义的话,算是锻炼个人的书写.总结能力,其二, ...
Java源码赏析（三）初识 String 类
由于String类比较复杂,现在采用多篇幅来讲述这一期主要从String使用的关键字,实现的接口,属性以及覆盖的方法入手.省略了大部分的字符串操作,比如split().trim().replace( ...
Java源码赏析（六）Class<T> 类
目的 Class 类是每一个程序员都必须了解的,也是使用反射机制的基础. 这篇文章将Class 类的公共方法大致介绍了一遍(省略了安全.枚举.断言.注解相关代码). 代码 package java.l ...
java源码学习（一）String
String表示字符串,Java中所有字符串的字面值都是String类的实例,例如"ABC".字符串是常量,在定义之后不能被改变,字符串缓冲区支持可变的字符串.因为 String ...
Java源码赏析（四）Java常见注解
元注解 @Target :标识注解的目标,默认为所有 ElementType.TYPE(用于类) ElementType.FIELD(用于域,包括enum) ElementType.METHOD(用于 ...
Java 源码赏析 - java.lang - Void
被人鄙视了,于是也来读读源码... package java.lang; /** * The Void class is an uninstantiable placeholder class to ...
Java入门篇（五）——字符串/String类
前面在举例时有出现过String的例子,当时肯定有一部分朋友不知道这个是做什么用的.其实String类是Java中一个比较特殊的类,字符串即String类,它不是Java的基本数据类型之一,但可以像基 ...
Java源码赏析（六）Java String 三顾
在大致了解了String之后,可能有的读者发现了,我们并没有谈到CharSequence接口. 原因是在这一节,CharSequence要和StringBuilder(Java1.5).StringB ...
Java源码赏析（二）Java常见接口
一.Comparable接口 package java.lang; import java.util.*; public interface Comparable<T> { /** * i ...

随机推荐

SVG的引入历程
直接引入编辑器会报错 Google: typescript svg cannot find module找到这个网址我放到了 shims-vue.d.ts 里面 declare module &q ...
ACM集训第一次积分赛赛前复习+day4
不知不觉4天过去了,我们迎来了我们第一次积分赛,赛前的四天我们学了以下知识点吧: day 1.排序之前一直想用qsort,但是总是写不明白,STL的sort()可以说是很方便了. 先写一个最基础的数 ...
Mybatis—curd
Mybatis简介: MyBatis 本是apache的一个开源项目iBatis, 2010年这个项目由apache software foundation 迁移到了google code,并且改名为 ...
7. Jackson用树模型处理JSON是必备技能，不信你看
每棵大树,都曾只是一粒种子.本文已被 https://www.yourbatman.cn 收录,里面一并有Spring技术栈.MyBatis.JVM.中间件等小而美的专栏供以免费学习.关注公众号[BA ...
【socket编程基础模板】
网络编程的基础是基于socket编程.socket(TCP)编程基于固定编程模板 server端: socket(声明socket类型) bind(命令socket,绑定地址和端口) listen(创 ...
e3mall商城的归纳总结4之图片服务器以及文本编辑器
一.图片服务器 --1.认识图片服务器大家可能都知道在分布式架构中使用图片上传可能会导致文件存放在某一个项目,而我们的项目基本上都采用集群的方式 ,因此这样会导致图片的问题比较难以存放,在这里我们有 ...
没想到吧！关于Dubbo的『消费端线程池模型』官网也写错了。
这是why的第 63 篇原创文章荒腔走板大家好,我是 why,欢迎来到我连续周更优质原创文章的第 63 篇.老规矩,先荒腔走板聊聊其他的. 上面这张图片是我前几天整理相册的时候看到的.拍摄于 20 ...
Linux文件描述符与重定向
文件描述符可以理解为linux跟踪打开文件,而分配的一个数字,这个数字有点类似c语言操作文件时候的句柄,通过句柄就可以实现文件的读写操作. 当Linux启动的时候会默认打开三个文件描述符,分别是: 标 ...
CTF线下awd攻防文件监控脚本
CTF线下awd攻防赛中常用一个文件监控脚本来保护文件,但是就博主对于该脚本的审计分析发现如下的问题: 1.记录文件的路径未修改导致log暴露原文件备份文件夹:drops_JWI96TY7ZKNMQ ...
平衡二叉搜索树/AVL二叉树 C实现
//AVTree.h #ifndef MY_AVLTREE_H #define MY_AVLTREE_H typedef int ElementType; struct TreeNode { Elem ...

Java源码赏析（五）再识 String 类

Java源码赏析（五）再识 String 类的更多相关文章

随机推荐

热门专题