String对象的不可变原因,String对象的内存布局,及String对象之间的执行==
,equals
,+
运算时的分析。
Author: Msuenb
Date: 2023-02-16
java.lang.String
类代表字符串。String 对象用于保存字符串,也就是一组字符序列。字符串是常量,它们的值在创建后不能更改。
String 的特点
String 是 final 类,不能被其他的类继承
String 类实现了 Comparable 接口,String 对象可以比较大小
String 对象内部是用字符数组保存字符串内容的
JDK9之前是
private final char value[]
数组,JDK9之后是 byte[] 数组"hello"
等效于char[] value = {'h', 'e', 'l', 'l', 'o'}
String 对象是不可变对象,一旦进行修改,就会产生新对象
注意:
- String 类的 char[] value 数组是 final 修饰的,说明 value 数组地址不可变,不是数组元素不可变
- 由于 value 数组是 private 的,所以在 String 类外无法直接修改 value 数组的元素值(除非用反射)
- String 类中的方法涉及到 value 数组长度变化,或修改元素值,都是用用新对象来表示修改后内容
final char[] value = {'h', 'e', 'l', 'l', 'o'};// value = new char[5]; // value 的地址不可修改value[0] = 'H'; // 可以修改 value 元素值String str = "hello";str = "world"; // 不会修改 "hello", 会在池中创建一个新的String对象接受 "world" str指向这个新对象 共会创建两个对象
String 对象不可变,可以共享(节省内存)。Java 中把需要共享的字符串常量对象存放在常量池中。
String s1 = "hello";String s2 = "hello";System.out.println(s1 == s2); // true// 内存中只有一个 "hello" 对象被创建,同时被s1和s2共享
创建String对象
总的来说,String 对象的创建方式有两种:直接赋值 和 使用构造器,这两种方式的机制是不一样的
- 直接赋值:
String str1 = "hello";
- 先从常量池中查看是否有 “hello” 数据空间,如果有,直接指向;如果没有,重新创建,然后指向。
- str1 最终指向的是常量池的空间地址
- 调用构造器:
String str2 = new String("hello")
- 先在堆中创建空间,里面维护了
char[] value
属性。 - 如果常量池中有 “hello” 数据空间,value 直接指向 “hello” 空间;如果没有,重新创建,然后指向。
- str2 最终指向的是堆中的空间地址;value 才是指向常量池的空间地址
- 先在堆中创建空间,里面维护了
String 内存分析
针对下面两行代码分析 String 对象的创建过程和内存布局
String str1 = "hello";String str2 = new String("hello");
String 内存布局:
String 对象创建过程:
String str1 = "hello";
- 先去查看常量池中是否有 “hello” 数据空间,没有,创建 “hello” 数据空间
- 将 “hello” 数据空间的地址返回给 String 对象引用 str
String str2 = new String("hello");
3. 先在堆中开辟空间,里面维护了 value 属性,str2 指向这片空间
4. 检查常量池中是否有 “hello” 数据空间,有,value 直接指向 “hello” 数据空间
哪些字符串对象地址放入字符串常量池:
需要共享的字符串地址记录到字符串常量池的table表中,不需要共享的字符串对象其地址值不需要记录到字符串常量池的table表中。除了以下2种,其他的都不放入字符串常量池:1. ""直接的字符串2. 字符串对象.intern()的结果 其他:1. 直接new2. valueOf,copyValueOf等3. 字符串对象拼接:concat拼接 以及 +左右两边出现 非直接""的字符串拼接4. toUpperCase,toLowerCase,substring,repalce等各种String方法得到的字符串其实下面这些方式,本质都是新new的,其地址都是指向堆空间。
String对象的创建形式
String对象的创建方式有两种,使用其它形式生成String对象,像valueOf()
或toString()
,它们在底层也是调用String的构造方法
直接赋值
String str = "hello";
构造方法
用于创建 String 对象的构造方法有很多,比较常用的有以下几个:
public String()
:其表示创建空字符序列。String(String original)
:其表示创建一个与参数相同的字符序列;也即新创建的字符串是该参数字符串的副本。public String(char[] value)
:通过当前参数中的字符数组来构造新的String。public String(byte[] bytes)
:通过使用默认字符集解码当前参数中的字节数组来构造新的String。也可以指定字符集
String str1 = new String(); // 创建一个空字符串String str2 = new String("hello");System.out.println(str1.equals("")); // truechar[] value = {'h', 'e', 'l', 'l', 'o'};// 字符数组String str3 = new String(value);byte[] bytes = {104, 101, 108, 108, 111};// 字节数组String str5 = new String(bytes);// hello
valueOf
和copyValueOf
方法:static String copyValueOf(char[] data): 返回指定数组中表示该字符序列的 String
static String valueOf(char[] data) : 返回指定数组中表示该字符序列的 String
static String valueOf(xx value):xx支持各种数据类型,返回各种数据类型的value参数的字符串表示形式。
char[] data = {'h','e','l','l','o','j','a','v','a'};String s1 = String.copyValueOf(data);String s2 = String.copyValueOf(data, 0, 5);// helloString s3 = String.valueOf(237);// 237
连接运算
+
任意数据类型与”字符串”进行拼接,结果都是字符串类型
int num = 123456;String s = num + "";Student stu = new Student();String s2 = stu + "";// 自动调用对象的toString(),然后与 "" 进行拼接
toString
方法Object 类中声明了 toString() 方法,因此任意对象都可以调用 toString 方法,转为字符串类型。
LocalDate today = LocalDate.now();String str = today.toString();System.out.println(str);
String对象比较== 与 equals
==
:比较的是两个字符串对象的地址boolean equals(Object obj)
方法:比较是两个字符串对象的内容(String 类重写了 equals 方法)
String str1 = "hello";String str2 = "hello";String str3 = new String("hello");String str4 = new String("hello");1System.out.println(str1 == str2); // truestr1 和 str2 都指向池中 "hello" 数据空间System.out.println(str1 == str3); // falsestr3 指向堆中System.out.println(str1.equals(str3)); // truestr1 与 str3 内容都是 "hello"System.out.println(str3 == str4); // falsestr3 与 str3 指向堆中不同的内存空间System.out.println(str3.equals(str4)); // trueSystem.out.println(str1 == str3.intern()); // trueSystem.out.println(str3 == str3.intern()); // false// 常量池中存在 "hello" 数据空间 str2.intern() 返回 "hello" 的引用 与str1相同
intern() 方法说明:执行
str2.intern()
时,会返回常量池中与 str2 内容相同的字符串常量的地址;若池中没有,则将 str2 添加到池中,并返回 str2 的引用
内存布局分析:
str1 和 str2 中的 value 都指向常量池中的 “hello” 数据空间,str1.value == str2.value。
compareTo方法
int compareTo(String str)
方法:String 类型实现了 Comparable 接口, 重写了 compareTo 方法,即 String 对象支持自然排序。
int compareTo(String str) 方法按照字符的 Unicode 编码值进行比较大小的
@Testpublic void test07() { String[] arr = {"java","linux","hadoop","hive","shell","flink","spark"}; Arrays.sort(arr); System.out.println(Arrays.toString(arr));}
+ 与 concat 的区别
拼接两个字符串的方式有两种:连接运算符+
和concat()
方法
String str1 = "hello,";String str2 = "world";String str3 = str1 + str2;String str4 = str1.concat(str2);System.out.println(str3); // helloworldSystem.out.println(str4); // helloworld
str1 + str2
:"..."
常量拼接,编译器直接优化为拼接后的字符串常量值。如,"abc" + "def"
优化等价于"abcdef"
- 非
"..."
常量拼接,编译器优化为 StringBuilder 的 append 方法,然后再把结果 toString。
String str1 = "hello";String str2 = "world";String str3 = "helloworld";String str4 = str1 + str2;// 非 "..." 直接字符串拼接String str5 = str1 + "world";// 非 "..." 直接字符串拼接String str6 = "hello" + "world";// "..." 直接字符串拼接等价于: String str6 = "helloworld";System.out.println(str3 == str4); // falseSystem.out.println(str3 == str5); // falseSystem.out.println(str3 == str6); // true
现在使用
debug
方式追一下String str5 = str1 + "world";
的执行过程,如下:先创建一个 StringBuilder 对象 sb,容量为16,初始为空。
执行
sb.append("hello");
执行
sb.append("world");
调用
sb.toString();
方法,返回 String 对象
最后 str5 会指向堆中的 String 对象,value[] 指向常量池中的 “helloworld” 数据空间。
注意:final String str1 = “hello”;// 此时 str1 完全等价于”hello”
final String s1 = "hello";//此时s1完全等价于"hello"final String s2 = "world";//此时s2完全等价于"world"String s3 = "helloworld";String s4 = s1 + s2;String s5 = s1 + "world";String s6 = "hello" + "world";System.out.println(s3 == s4);//trueSystem.out.println(s3 == s5);//trueSystem.out.println(s3 == s6);//true
str1.concat(str2)
:只要拼接的不是空字符串,每次都 new 一个 StringString str1 = "hello";String str2 = "world";String str3 = "helloworld";String str4 = str1.concat(str2);// str2 不是空串 创建一个新对象接受连接后的内容String str5 = str1.concat("world");String str6 = "hello".concat("world");System.out.println(str3 == str4); // falseSystem.out.println(str3 == str5); // falseSystem.out.println(str3 == str6); // false
concat(String)
方法源码:
可变字符序列
因为 String 对象是不可变对象,虽然可以共享常量对象,但是对于频繁字符串的修改和拼接操作,效率极低。因此 Java 提供了可变字符序列 StringBuilder 和 StringBuffer 类型。
StringBuffer
:线程安全的(方法有 synchronized 修饰)StringBuilder
:线程不安全的
StringBuffer和StringBuilder
StringBuffer 与 StringBuilder 最大区别就是在于 StringBuffer 是线程安全的,支持多线程访问;StringBuilder是线程不安全的,在单线程下使用。
StringBuilder 的效率要高于 StringBuffer,通常情况先建议使用 StringBuilder,但在要求线程安全的情况下需要使用String Buffer。
其他方面 StringBuffer 与 StringBuilder 相似:
StringBuffer 和 StringBuilder 都是 final 类,不能被继承
StringBuffer 和 StringBuilder 都继承自 AbstractStringBuilder,有属性
char[] value
,用于存放字符串内容,由于 value 不是 final 类型,因此 value 数组里的内容存放在堆空间,而不是常量池。
StringBuffer 和 StringBuilder 都不用每次都需要创建新对象,所有效高于 String
StringBuffer 和 StringBuilder 有相同扩容机制:初始容量
capacity = 16
,每次扩容为capacity = 2 * capacity + 2
常用的API,StringBuilder、StringBuffer是完全一致的:
StringBuffer append(xx):拼接,追加
StringBuffer insert(int index, xx):在 [index] 位置插入 xx
StringBuffer deleteCharAt(int index):删除[index]位置字符
void setCharAt(int index, xx):替换[index]位置字符
StringBuffer reverse():反转
int indexOf(String str):在当前字符序列中查询str的第一次出现下标
@Testpublic void test1(){ StringBuilder s = new StringBuilder(); s.append("hello").append(true).append('a').append(12).append("world"); System.out.println(s); System.out.println(s.length());}@Testpublic void test2(){ StringBuilder s = new StringBuilder("helloworld"); s.insert(5, "java"); System.out.println(s);}@Testpublic void test3(){ StringBuilder s = new StringBuilder("helloworld"); s.deleteCharAt(4); System.out.println(s);}@Testpublic void test4(){ StringBuilder s = new StringBuilder("helloworld"); s.reverse(); System.out.println(s);}@Testpublic void test5(){ StringBuilder s = new StringBuilder("helloworld"); s.setCharAt(2, 'a'); System.out.println(s);}@Testpublic void test6(){ StringBuilder s = new StringBuilder("helloworld"); int index = s.indexOf("owo"); System.out.println(index);}
String,StringBuffer,StringBuilder效率测试
import org.junit.jupiter.api.Test;public class EfficiencyTest { @Test public void test() { long start = System.currentTimeMillis(); stringTest(); // stringBufferTest(); // stringBuilderTest(); long end = System.currentTimeMillis(); long memory = Runtime.getRuntime().totalMemory() - Runtime.getRuntime().freeMemory(); System.out.println("String拼接+用时:" + (end - start)); System.out.println("String拼接+占用内存: " + memory); // String StringBuffer StringBuilder // time 5986 5 3 // memory 57263088 43127632 43127912 } public void stringTest() { String str = new String("0"); for (int i = 0; i < 50000; i++) { str += i; } } public void stringBufferTest() { StringBuffer sb = new StringBuffer("0"); for (int i = 0; i < 50000; i++) { sb.append(i); } } public void stringBuilderTest() { StringBuilder sb = new StringBuilder("0"); for (int i = 0; i < 50000; i++) { sb.append(i); } }}