String.intern() 祛魅

String.intern(),写应用的同学不知道也没什么损失。但知道的同学,如果只觉得它很省内存,用==比较字符串很酷,或者期待JDK会做什么神奇的事情,然后恨不得所有地方都用上String.intern(),那很可能会误用,所以把上周在群里的讨论整理成此文。

在社会科学中,祛魅(Disenchantment)是指在现代社会中消去神秘主义(魅惑力)的表面并把文化合理化。这里乱用一下。

1. String.itern()的基本原理

详细可看占小狼同学的《浅谈Java String内幕(2)》

String.intern()是一个Native方法,底层调用C++的 StringTable::intern 方法,源码注释:当调用 intern 方法时,如果常量池中已经该字符串,则返回池中的字符串;否则将此字符串添加到常量池中,并返回字符串的引用。

所以明面上,它有两大好处,一是重复的字符串,会用同一个引用代替;二是字符串比较,不再需要逐个字符的equals()比较,而用==对比引用是否相同即可。

2. 省内存效果只对长期存在的字符串有效

String.intern()没有神奇的地方,只在字符串生成后,再去常量池里查找引用。所以字符串最初生成时所花的内存,是省不掉的。

String s = new String(bytes, “UTF-8”).intern();
String s = String.valueOf(i).intern();

只有大量对象放在长期存在的集合里,里面是大量重复的字符串,或者对象的属性是重复的字符串时,省内存的效果才显现出来。短生命周期的字符串,GC要干的活是一样的。 

3. 执行路径上多次的==,才能抵消常量池HasHMap查找的代价

==当然比equals()快得多,但常量池其实是个HashMap,依然没有神奇的地方,依然要执行HashMap的get操作,所以,一次hashCode() 和至少一次的equals()已经预付了,如果hash冲突,那equals()次数更多。

4. 真的对性能影响甚微吗?

在我的服务化框架测试里,把几个Header字段intern了,性能立马从七万五调到七万一 QPS,原来从七万一升到七万五 ,曾做过多少效果甚微的优化加上一次Netty使用的优化而成,现在它掉下来倒是飞快。

PS. 七万五 20%CPU这个数字,这两周的博客里都没升过了: ( 

5. 小陷阱

来自R大的提醒, s.intern()是无效的,因为String是不变对象, String s1 = s.intern()后,这个s1才是个引用。

Java的常量池也是不省心的,要注意JDK版本,占小狼同学的《浅谈Java String内幕(2)》

PS. 唯品会广州的基础架构部现在只剩最后一个架构师的名额了,欲投简历请趁早, calvinxiao@vipshop.com



相关文章

发表评论

Comment form

(*) 表示必填项

还没有评论。

跳到底部
返回顶部