- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我了解 basic idea java 的 String 实习,但我试图弄清楚它发生在哪些情况下,以及我需要做我自己的 flyweighting。
有点相关:
他们一起告诉我 String s = "foo"
好而 String s = new String("foo")
不好但没有提到任何其他情况。
特别是,如果我解析一个有很多重复值的文件(比如 csv),Java 的字符串实习会覆盖我还是我需要自己做些什么?关于字符串实习是否适用于我的 other question,我得到了相互矛盾的建议
完整的答案分为几个片段,所以我在这里总结一下:
默认情况下,java 只保留编译时已知的字符串。 String.intern(String)
可以在运行时使用,但性能不是很好,所以它只适用于您确定的较小数量的 String
将多次重复。对于更大的字符串集,Guava 可以解决问题(请参阅 ColinD 的回答)。
最佳答案
一个选项Guava这里给你的是使用Interner而不是使用 String.intern()
。与 String.intern()
不同,Guava Interner
使用堆而不是永久代。此外,您还可以选择使用弱引用对 String
进行实习,这样当您使用完那些 String
时,Interner
就会获胜' 防止它们被垃圾收集。但是,如果您以这样的方式使用 Interner
,当您完成对字符串的处理后它会被丢弃,那么您可以只对 Interners.newStrongInterner()
使用强引用以获得更好的性能。
Interner<String> interner = Interners.newWeakInterner();
String a = interner.intern(getStringFromCsv());
String b = interner.intern(getStringFromCsv());
// if a.equals(b), a == b will be true
关于java - 什么时候对 Java 中的享元字符串有益?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3972841/
我是 java 正则表达式的新手。我在 Docs 中看到了这个: $ The end of a line 但是当我尝试这个片段时: String str = "firstline\r\nsecondl
我需要在 apache (httpd) 中设置 500 个不同的虚拟主机,并且配置相同。我认为可以使用元字符或循环,而不是复制相同的 500 次......我尝试搜索一些信息,但找不到任何解决方法。有
我正在使用 os.walk(directory) 递归地显示该目录中的所有文件。问题是我只需要显示名称中包含询问字符串的文件,而且它还必须管理元字符。 我现在拥有的是: for root, subdi
下表包含了元字符的完整列表以及它们在正则表达式上下文中的行为: 字符 描述 \ 将下一个字符标记为一个特殊字
在练习中,我编写了一个由最多匹配 3 个大写字符的元字符组成的表达式。 例子 a -> match A -> match Ab -> match AbC -> match AbCd -> match
我正在学习 Java OCP 证书。我正在参加模拟考试来准备。 示例程序: public class Quetico { public static void main(String[] ar
Haskell PCRE 库是否提供了转义字符串中正则表达式元字符的函数? IE。一个函数,用于将“[$100]”这样的字符串转换为“\[\$100\]”。 我正在寻找Python的re.escape
我研究过,我知道 '?'如果结果在匹配函数中出现 0 次或 1 次,则用于匹配。不幸的是,我找不到一个明确的例子来说明“?”到底是什么?匹配。 干杯。 最佳答案 正则表达式 co?at 将匹配 coa
我正在尝试转义 Java 中的 RegExp 元字符。以下是我想要的: INPUT STRING: "This is $ test" OUTPUT STRING: "This is \$ test"
什么是正则表达式呢? 正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),它是计算机科学的一个概念。正则表达式使用单
说到shell通配符(wildcard),大家在使用时候会经常用到。 下面是一个实例: [chengmo@localhost ~/shell]$ ls a.txt b.txt c.old
我现在很困惑。 期待 documentation陈述如下: Remember that Pexpect does NOT interpret shell meta characters such as
\D元字符可以匹配非数字字符,等价于"[^0-9]"。 语法结构: (1).构造函数方式: new RegExp("\\D") (2).对象直接量方式
我是一名优秀的程序员,十分优秀!