关于Java的谣言之字符串+的性能问题
2017-07-06 17:24
197 查看
“Java中字符串连接不要用+号,这样效率低”。很多人都被这么教育过,我也深信这个原则,因此我以前写字符串拼接时,即使是简单的两个字符串拼接也要搞一个StringBuffer之类的东西,直到后来公司Java讨论群里,有一个大神说现在的年轻人根本不深入研究,看到别人说什么就人云亦云,也不动手实践,Java字符串连接用+号性能低这种早就被证伪的东西居然还有人信。之后大神又说了一下原理,我这才觉得自己以前被深深的欺骗了。那么究竟是什么原因会有这样一个谣言呢?参考:http://www.blogjava.net/nokiaguy/archive/2008/05/07/198990.html这篇文章,一下为复制内容:
字符串是Java程序中最常用的一种数据结构之一。在Java中的String类已经重载的"+"。也就是说,字符串可以直接使用"+"进行连接,如下面代码所示:
String s = "abc" + "ddd";
但这样做真的好吗?当然,这个问题不能简单地回答yes or no。要根据具体情况来定。在Java中提供了一个StringBuilder类(这个类只在J2SE5及以上版本提供,以前的版本使用StringBuffer类),这个类也可以起到"+"的作用。那么我们应该用哪个呢?
下面让我们先看看如下的代码:
package string;
public class TestSimplePlus
{
public static void main(String[] args)
{
String s = "abc";
String ss = "ok" + s + "xyz" + 5;
System.out.println(ss);
}
}
上面的代码将会输出正确的结果。从表面上看,对字符串和整型使用"+"号并没有什么区别,但事实真的如此吗?下面让我们来看看这段代码的本质。
我们首先使用反编译工具(如jdk带的javap、或jad)将TestSimplePlus反编译成Java Byte Code,其中的奥秘就一目了然了。在本文将使用jad来反编译,命令如下:
jad -o -a -s d.java TestSimplePlus.class
反编译后的代码如下:
package string;
import java.io.PrintStream;
public class TestSimplePlus
{
public TestSimplePlus()
{
// 0 0:aload_0
// 1 1:invokespecial #8 <Method void Object()>
// 2 4:return
}
public static void main(String args[])
{
String s = "abc";
// 0 0:ldc1 #16 <String "abc">
// 1 2:astore_1
String ss = (new StringBuilder("ok")).append(s).append("xyz").append(5).toString();
// 2 3:new #18 <Class StringBuilder>
// 3 6:dup
// 4 7:ldc1 #20 <String "ok">
// 5 9:invokespecial #22 <Method void StringBuilder(String)>
// 6 12:aload_1
// 7 13:invokevirtual #25 <Method StringBuilder StringBuilder.append(String)>
// 8 16:ldc1 #29 <String "xyz">
// 9 18:invokevirtual #25 <Method StringBuilder StringBuilder.append(String)>
// 10 21:iconst_5
// 11 22:invokevirtual #31 <Method StringBuilder StringBuilder.append(int)>
// 12 25:invokevirtual #34 <Method String StringBuilder.toString()>
// 13 28:astore_2
System.out.println(ss);
// 14 29:getstatic #38 <Field PrintStream System.out>
// 15 32:aload_2
// 16 33:invokevirtual #44 <Method void PrintStream.println(String)>
// 17 36:return
}
}
读者可能看到上面的Java字节码感到迷糊,不过大家不必担心。本文的目的并不是讲解Java Byte Code,因此,并不用了解具体的字节码的含义。
使用jad反编译的好处之一就是可以同时生成字节码和源代码。这样可以进行对照研究。从上面的代码很容易看出,虽然在源程序中使用了"+",但在编译时仍然将"+"转换成StringBuilder。因此,我们可以得出结论,在Java中无论使用何种方式进行字符串连接,实际上都使用的是StringBuilder。
那么是不是可以根据这个结论推出使用"+"和StringBuilder的效果是一样的呢?这个要从两个方面的解释。如果从运行结果来解释,那么"+"和StringBuilder是完全等效的。但如果从运行效率和资源消耗方面看,那它们将存在很大的区别。
当然,如果连接字符串行表达式很简单(如上面的顺序结构),那么"+"和StringBuilder基本是一样的,但如果结构比较复杂,如使用循环来连接字符串,那么产生的Java Byte Code就会有很大的区别。先让我们看看如下的代码:
package string;
import java.util.*;
public class TestComplexPlus
{
public static void main(String[] args)
{
String s = "";
Random rand = new Random();
for (int i = 0; i < 10; i++)
{
s = s + rand.nextInt(1000) + " ";
}
System.out.println(s);
}
}
上面的代码返编译后的Java Byte Code如下:
package string;
import java.io.PrintStream;
import java.util.Random;
public class TestComplexPlus
{
public TestComplexPlus()
{
// 0 0:aload_0
// 1 1:invokespecial #8 <Method void Object()>
// 2 4:return
}
public static void main(String args[])
{
String s = "";
// 0 0:ldc1 #16 <String "">
// 1 2:astore_1
Random rand = new Random();
// 2 3:new #18 <Class Random>
// 3 6:dup
// 4 7:invokespecial #20 <Method void Random()>
// 5 10:astore_2
for(int i = 0; i < 10; i++)
//* 6 11:iconst_0
//* 7 12:istore_3
//* 8 13:goto 49
s = (new StringBuilder(String.valueOf(s))).append(rand.nextInt(1000)).append(" ").toString();
// 9 16:new #21 <Class StringBuilder>
// 10 19:dup
// 11 20:aload_1
// 12 21:invokestatic #23 <Method String String.valueOf(Object)>
// 13 24:invokespecial #29 <Method void StringBuilder(String)>
// 14 27:aload_2
// 15 28:sipush 1000
// 16 31:invokevirtual #32 <Method int Random.nextInt(int)>
// 17 34:invokevirtual #36 <Method StringBuilder StringBuilder.append(int)>
// 18 37:ldc1 #40 <String " ">
// 19 39:invokevirtual #42 <Method StringBuilder StringBuilder.append(String)>
// 20 42:invokevirtual #45 <Method String StringBuilder.toString()>
// 21 45:astore_1
// 22 46:iinc 3 1
// 23 49:iload_3
// 24 50:bipush 10
// 25 52:icmplt 16
System.out.println(s);
// 26 55:getstatic #49 <Field PrintStream System.out>
// 27 58:aload_1
// 28 59:invokevirtual #55 <Method void PrintStream.println(String)>
// 29 62:return
}
}
大家可以看到,虽然编译器将"+"转换成了StringBuilder,但创建StringBuilder对象的位置却在for语句内部。这就意味着每执行一次循环,就会创建一个StringBuilder对象(对于本例来说,是创建了10个StringBuilder对象),虽然Java有垃圾回收器,但这个回收器的工作时间是不定的。如果不断产生这样的垃圾,那么仍然会占用大量的资源。解决这个问题的方法就是在程序中直接使用StringBuilder来连接字符串,代码如下:
package string;
import java.util.*;
public class TestStringBuilder
{
public static void main(String[] args)
{
String s = "";
Random rand = new Random();
StringBuilder result = new StringBuilder();
for (int i = 0; i < 10; i++)
{
result.append(rand.nextInt(1000));
result.append(" ");
}
System.out.println(result.toString());
}
}
上面代码反编译后的结果如下:
package string;
import java.io.PrintStream;
import java.util.Random;
public class TestStringBuilder
{
public TestStringBuilder()
{
// 0 0:aload_0
// 1 1:invokespecial #8 <Method void Object()>
// 2 4:return
}
public static void main(String args[])
{
String s = "";
// 0 0:ldc1 #16 <String "">
// 1 2:astore_1
Random rand = new Random();
// 2 3:new #18 <Class Random>
// 3 6:dup
// 4 7:invokespecial #20 <Method void Random()>
// 5 10:astore_2
StringBuilder result = new StringBuilder();
// 6 11:new #21 <Class StringBuilder>
// 7 14:dup
// 8 15:invokespecial #23 <Method void StringBuilder()>
// 9 18:astore_3
for(int i = 0; i < 10; i++)
//* 10 19:iconst_0
//* 11 20:istore 4
//* 12 22:goto 47
{
result.append(rand.nextInt(1000));
// 13 25:aload_3
// 14 26:aload_2
// 15 27:sipush 1000
// 16 30:invokevirtual #24 <Method int Random.nextInt(int)>
// 17 33:invokevirtual #28 <Method StringBuilder StringBuilder.append(int)>
// 18 36:pop
result.append(" ");
// 19 37:aload_3
// 20 38:ldc1 #32 <String " ">
// 21 40:invokevirtual #34 <Method StringBuilder StringBuilder.append(String)>
// 22 43:pop
}
// 23 44:iinc 4 1
// 24 47:iload 4
// 25 49:bipush 10
// 26 51:icmplt 25
System.out.println(result.toString());
// 27 54:getstatic #37 <Field PrintStream System.out>
// 28 57:aload_3
// 29 58:invokevirtual #43 <Method String StringBuilder.toString()>
// 30 61:invokevirtual #47 <Method void PrintStream.println(String)>
// 31 64:return
}
}
从上面的反编译结果可以看出,创建StringBuilder的代码被放在了for语句外。虽然这样处理在源程序中看起来复杂,但却换来了更高的效率,同时消耗的资源也更少了。
在使用StringBuilder时要注意,尽量不要"+"和StringBuilder混着用,否则会创建更多的StringBuilder对象,如下面代码所:
for (int i = 0; i < 10; i++)
{
result.append(rand.nextInt(1000));
result.append(" ");
}
改成如下形式:
for (int i = 0; i < 10; i++)
{
result.append(rand.nextInt(1000) + " ");
}
则反编译后的结果如下:
for(int i = 0; i < 10; i++)
//* 10 19:iconst_0
//* 11 20:istore 4
//* 12 22:goto 65
{
result.append((new StringBuilder(String.valueOf(rand.nextInt(1000)))).append(" ").toString());
// 13 25:aload_3
// 14 26:new #21 <Class StringBuilder>
// 15 29:dup
从上面的代码可以看出,Java编译器将"+"编译成了StringBuilder,这样for语句每循环一次,又创建了一个StringBuilder对象。
如果将上面的代码在JDK1.4下编译,必须将StringBuilder改为StringBuffer,而JDK1.4将"+"转换为StringBuffer(因为JDK1.4并没有提供StringBuilder类)。StringBuffer和StringBuilder的功能基本一样,只是StringBuffer是线程安全的,而StringBuilder不是线程安全的。因此,StringBuilder的效率会更高。
总结,也就是说普通的字符串连接,用+号是没问题的,如果是在循环里,需要注意一下,否则真的会有性能问题了。
字符串是Java程序中最常用的一种数据结构之一。在Java中的String类已经重载的"+"。也就是说,字符串可以直接使用"+"进行连接,如下面代码所示:
String s = "abc" + "ddd";
但这样做真的好吗?当然,这个问题不能简单地回答yes or no。要根据具体情况来定。在Java中提供了一个StringBuilder类(这个类只在J2SE5及以上版本提供,以前的版本使用StringBuffer类),这个类也可以起到"+"的作用。那么我们应该用哪个呢?
下面让我们先看看如下的代码:
package string;
public class TestSimplePlus
{
public static void main(String[] args)
{
String s = "abc";
String ss = "ok" + s + "xyz" + 5;
System.out.println(ss);
}
}
上面的代码将会输出正确的结果。从表面上看,对字符串和整型使用"+"号并没有什么区别,但事实真的如此吗?下面让我们来看看这段代码的本质。
我们首先使用反编译工具(如jdk带的javap、或jad)将TestSimplePlus反编译成Java Byte Code,其中的奥秘就一目了然了。在本文将使用jad来反编译,命令如下:
jad -o -a -s d.java TestSimplePlus.class
反编译后的代码如下:
package string;
import java.io.PrintStream;
public class TestSimplePlus
{
public TestSimplePlus()
{
// 0 0:aload_0
// 1 1:invokespecial #8 <Method void Object()>
// 2 4:return
}
public static void main(String args[])
{
String s = "abc";
// 0 0:ldc1 #16 <String "abc">
// 1 2:astore_1
String ss = (new StringBuilder("ok")).append(s).append("xyz").append(5).toString();
// 2 3:new #18 <Class StringBuilder>
// 3 6:dup
// 4 7:ldc1 #20 <String "ok">
// 5 9:invokespecial #22 <Method void StringBuilder(String)>
// 6 12:aload_1
// 7 13:invokevirtual #25 <Method StringBuilder StringBuilder.append(String)>
// 8 16:ldc1 #29 <String "xyz">
// 9 18:invokevirtual #25 <Method StringBuilder StringBuilder.append(String)>
// 10 21:iconst_5
// 11 22:invokevirtual #31 <Method StringBuilder StringBuilder.append(int)>
// 12 25:invokevirtual #34 <Method String StringBuilder.toString()>
// 13 28:astore_2
System.out.println(ss);
// 14 29:getstatic #38 <Field PrintStream System.out>
// 15 32:aload_2
// 16 33:invokevirtual #44 <Method void PrintStream.println(String)>
// 17 36:return
}
}
读者可能看到上面的Java字节码感到迷糊,不过大家不必担心。本文的目的并不是讲解Java Byte Code,因此,并不用了解具体的字节码的含义。
使用jad反编译的好处之一就是可以同时生成字节码和源代码。这样可以进行对照研究。从上面的代码很容易看出,虽然在源程序中使用了"+",但在编译时仍然将"+"转换成StringBuilder。因此,我们可以得出结论,在Java中无论使用何种方式进行字符串连接,实际上都使用的是StringBuilder。
那么是不是可以根据这个结论推出使用"+"和StringBuilder的效果是一样的呢?这个要从两个方面的解释。如果从运行结果来解释,那么"+"和StringBuilder是完全等效的。但如果从运行效率和资源消耗方面看,那它们将存在很大的区别。
当然,如果连接字符串行表达式很简单(如上面的顺序结构),那么"+"和StringBuilder基本是一样的,但如果结构比较复杂,如使用循环来连接字符串,那么产生的Java Byte Code就会有很大的区别。先让我们看看如下的代码:
package string;
import java.util.*;
public class TestComplexPlus
{
public static void main(String[] args)
{
String s = "";
Random rand = new Random();
for (int i = 0; i < 10; i++)
{
s = s + rand.nextInt(1000) + " ";
}
System.out.println(s);
}
}
上面的代码返编译后的Java Byte Code如下:
package string;
import java.io.PrintStream;
import java.util.Random;
public class TestComplexPlus
{
public TestComplexPlus()
{
// 0 0:aload_0
// 1 1:invokespecial #8 <Method void Object()>
// 2 4:return
}
public static void main(String args[])
{
String s = "";
// 0 0:ldc1 #16 <String "">
// 1 2:astore_1
Random rand = new Random();
// 2 3:new #18 <Class Random>
// 3 6:dup
// 4 7:invokespecial #20 <Method void Random()>
// 5 10:astore_2
for(int i = 0; i < 10; i++)
//* 6 11:iconst_0
//* 7 12:istore_3
//* 8 13:goto 49
s = (new StringBuilder(String.valueOf(s))).append(rand.nextInt(1000)).append(" ").toString();
// 9 16:new #21 <Class StringBuilder>
// 10 19:dup
// 11 20:aload_1
// 12 21:invokestatic #23 <Method String String.valueOf(Object)>
// 13 24:invokespecial #29 <Method void StringBuilder(String)>
// 14 27:aload_2
// 15 28:sipush 1000
// 16 31:invokevirtual #32 <Method int Random.nextInt(int)>
// 17 34:invokevirtual #36 <Method StringBuilder StringBuilder.append(int)>
// 18 37:ldc1 #40 <String " ">
// 19 39:invokevirtual #42 <Method StringBuilder StringBuilder.append(String)>
// 20 42:invokevirtual #45 <Method String StringBuilder.toString()>
// 21 45:astore_1
// 22 46:iinc 3 1
// 23 49:iload_3
// 24 50:bipush 10
// 25 52:icmplt 16
System.out.println(s);
// 26 55:getstatic #49 <Field PrintStream System.out>
// 27 58:aload_1
// 28 59:invokevirtual #55 <Method void PrintStream.println(String)>
// 29 62:return
}
}
大家可以看到,虽然编译器将"+"转换成了StringBuilder,但创建StringBuilder对象的位置却在for语句内部。这就意味着每执行一次循环,就会创建一个StringBuilder对象(对于本例来说,是创建了10个StringBuilder对象),虽然Java有垃圾回收器,但这个回收器的工作时间是不定的。如果不断产生这样的垃圾,那么仍然会占用大量的资源。解决这个问题的方法就是在程序中直接使用StringBuilder来连接字符串,代码如下:
package string;
import java.util.*;
public class TestStringBuilder
{
public static void main(String[] args)
{
String s = "";
Random rand = new Random();
StringBuilder result = new StringBuilder();
for (int i = 0; i < 10; i++)
{
result.append(rand.nextInt(1000));
result.append(" ");
}
System.out.println(result.toString());
}
}
上面代码反编译后的结果如下:
package string;
import java.io.PrintStream;
import java.util.Random;
public class TestStringBuilder
{
public TestStringBuilder()
{
// 0 0:aload_0
// 1 1:invokespecial #8 <Method void Object()>
// 2 4:return
}
public static void main(String args[])
{
String s = "";
// 0 0:ldc1 #16 <String "">
// 1 2:astore_1
Random rand = new Random();
// 2 3:new #18 <Class Random>
// 3 6:dup
// 4 7:invokespecial #20 <Method void Random()>
// 5 10:astore_2
StringBuilder result = new StringBuilder();
// 6 11:new #21 <Class StringBuilder>
// 7 14:dup
// 8 15:invokespecial #23 <Method void StringBuilder()>
// 9 18:astore_3
for(int i = 0; i < 10; i++)
//* 10 19:iconst_0
//* 11 20:istore 4
//* 12 22:goto 47
{
result.append(rand.nextInt(1000));
// 13 25:aload_3
// 14 26:aload_2
// 15 27:sipush 1000
// 16 30:invokevirtual #24 <Method int Random.nextInt(int)>
// 17 33:invokevirtual #28 <Method StringBuilder StringBuilder.append(int)>
// 18 36:pop
result.append(" ");
// 19 37:aload_3
// 20 38:ldc1 #32 <String " ">
// 21 40:invokevirtual #34 <Method StringBuilder StringBuilder.append(String)>
// 22 43:pop
}
// 23 44:iinc 4 1
// 24 47:iload 4
// 25 49:bipush 10
// 26 51:icmplt 25
System.out.println(result.toString());
// 27 54:getstatic #37 <Field PrintStream System.out>
// 28 57:aload_3
// 29 58:invokevirtual #43 <Method String StringBuilder.toString()>
// 30 61:invokevirtual #47 <Method void PrintStream.println(String)>
// 31 64:return
}
}
从上面的反编译结果可以看出,创建StringBuilder的代码被放在了for语句外。虽然这样处理在源程序中看起来复杂,但却换来了更高的效率,同时消耗的资源也更少了。
在使用StringBuilder时要注意,尽量不要"+"和StringBuilder混着用,否则会创建更多的StringBuilder对象,如下面代码所:
for (int i = 0; i < 10; i++)
{
result.append(rand.nextInt(1000));
result.append(" ");
}
改成如下形式:
for (int i = 0; i < 10; i++)
{
result.append(rand.nextInt(1000) + " ");
}
则反编译后的结果如下:
for(int i = 0; i < 10; i++)
//* 10 19:iconst_0
//* 11 20:istore 4
//* 12 22:goto 65
{
result.append((new StringBuilder(String.valueOf(rand.nextInt(1000)))).append(" ").toString());
// 13 25:aload_3
// 14 26:new #21 <Class StringBuilder>
// 15 29:dup
从上面的代码可以看出,Java编译器将"+"编译成了StringBuilder,这样for语句每循环一次,又创建了一个StringBuilder对象。
如果将上面的代码在JDK1.4下编译,必须将StringBuilder改为StringBuffer,而JDK1.4将"+"转换为StringBuffer(因为JDK1.4并没有提供StringBuilder类)。StringBuffer和StringBuilder的功能基本一样,只是StringBuffer是线程安全的,而StringBuilder不是线程安全的。因此,StringBuilder的效率会更高。
总结,也就是说普通的字符串连接,用+号是没问题的,如果是在循环里,需要注意一下,否则真的会有性能问题了。
相关文章推荐
- (转)java关于split分割字符串,空的字符串不能得到的问题
- 关于Java的中英文混合截取字符串的问题解决方法
- 关于在Java使用反射对属性取值和赋值的性能问题。
- 关于java字符串的部分问题
- 关于java.sql.SQLException: [Microsoft][ODBC 驱动程序管理器] 无效的字符串或缓冲区长度问题
- JAVA与C++::关于JNI中文字符串操作问题总结
- 关于java将String类型的时间字符串转换为Date类型的问题
- Java中关于Json对象类型和字符串类型之间互相转化的问题
- 关于json反序列化字符串为java对象时科学计数法和精度问题
- 关于 用java 程序将字符串 保存为 windows ANSI编码格式 txt 文本的 问题解决
- 关于String 拼接字符串的性能问题
- JAVA关于方法调用的代码写法与性能问题
- Java中关于Json对象类型和字符串类型之间互相转化的问题 .
- java关于split分割字符串,空的字符串不能得到的问题
- 关于Java中split方法对空字符串处理问题
- 你不得不知道的关于JavaScript 中字符串连接的性能问题
- 关于字符串数组赋值的问题--java.lang.NullPointerException异常
- 用java写关于删除一个字符串的字符以及删除一个字符串与另一个字符串中相同字符的问题
- Java初学者必知 关于Java字符串问题
- java关于split分割字符串,空的字符串不能得到的问题