gpt4 book ai didi

Java JDBC 不是重用 String 值吗?

转载 作者:搜寻专家 更新时间:2023-11-01 02:02:45 25 4
gpt4 key购买 nike

我和我的同事在应用程序中遇到了一些内存问题,我们发现来自数据库(高度重复)的字符串值实际上没有被保留。因此,重复的值保存在内存中,这可能是一个巨大的问题。

例如,这是一个简单的 JDBC 示例,它从 SQLite 数据库中查询相同的字符串。我打印每个的身份哈希码,它显示每个都是一个单独的实例。

import java.sql.*;

public class Test {
public static void main(String[] args)
{
Connection connection = null;
try
{
// create a database connection
connection = DriverManager.getConnection("jdbc:sqlite:/C:/rexon_metals.db");
Statement statement = connection.createStatement();

ResultSet rs = statement.executeQuery("SELECT REGION FROM CUSTOMER WHERE REGION = 'Southwest'");
while(rs.next())
{
String region = rs.getString("REGION");
System.out.println(region + ": " + System.identityHashCode(region));
}
}
catch(SQLException e)
{
// if the error message is "out of memory",
// it probably means no database file is found
System.err.println(e.getMessage());
}
finally
{
try
{
if(connection != null)
connection.close();
}
catch(SQLException e)
{
// connection close failed.
System.err.println(e);
}
}
}
}

输出:

Southwest: 405662939
Southwest: 653305407
Southwest: 1130478920
Southwest: 1404928347

但是如果我显式调用 String.intern() 方法,所有的身份哈希码都是相同的。

String region = rs.getString("REGION").intern();

输出:

Southwest: 405662939
Southwest: 405662939
Southwest: 405662939
Southwest: 405662939

为什么 JDBC 不为我调用 intern()?如果存在许多重复的 String 值,开发人员是否应该这样做?在整个应用程序 session 期间频繁使用并持续存在的那些?

附言- 有数百万个字符串值可以合并为几百个。这是否保证手动 intern() 调用呢?

最佳答案

JDBC 驱动程序不会保留您从数据库中检索到的字符串数据。

您需要考虑到实习的成本相对较高,并且驱动程序无法轻易预测哪些数据是高度重复的,哪些不是 - 特别是因为 JDBC 结果集很可能是在客户端代码时从数据库逐位流入的遍历它。

如果内存是您的应用程序的主要瓶颈并且您的字符串数据是高度重复的,您可以手动对其进行 intern()。请注意,这仍然不会阻止驱动程序创建字符串,唯一改变的是副本一旦超出范围就会变成可回收垃圾。

但是如果你的数据库中有这样重复的字符串,我肯定会首先检查数据库是否设计得当。如果事实证明字符串实际上代表一个固定的集合,请考虑将它们变成一个代码表,可以用例如只是一个 ID。

关于Java JDBC 不是重用 String 值吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41902421/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com