磁盘上的 Java 数组批量刷新-6ren

磁盘上的 Java 数组批量刷新

转载作者：塔克拉玛干更新时间：2023-11-02 18:58:25

25

4

我有两个数组(int 和 long)，其中包含数百万个条目。到目前为止，我一直在使用 DataOutputStream 并使用长缓冲区，因此磁盘 I/O 成本变低(nio 也或多或少与我有巨大的缓冲区相同，因此 I/O 访问成本低)特别是，使用

DataOutputStream dos = new DataOutputStream(new BufferedOutputStream(new FileOutputStream("abc.txt"),1024*1024*100));

for(int i = 0 ; i < 220000000 ; i++){
    long l = longarray[i];
    dos.writeLong(l);
}

但这样做需要几秒钟(超过 5 分钟)。实际上，我想要批量刷新(某种主内存到磁盘内存映射)。为此，我在 here 中找到了一个不错的方法和 here .但是，无法理解如何在我的 javac 中使用它。任何人都可以帮助我解决这个问题或以任何其他方式很好地做到这一点吗？

最佳答案

在我的机器上，3.8 GHz i7 和 SSD

DataOutputStream dos = new DataOutputStream(new BufferedOutputStream(new FileOutputStream("abc.txt"), 32 * 1024));

long start = System.nanoTime();
final int count = 220000000;
for (int i = 0; i < count; i++) {
    long l = i;
    dos.writeLong(l);
}
dos.close();
long time = System.nanoTime() - start;
System.out.printf("Took %.3f seconds to write %,d longs%n",
        time / 1e9, count);

打印

Took 11.706 seconds to write 220,000,000 longs

使用内存映射文件

final int count = 220000000;

final FileChannel channel = new RandomAccessFile("abc.txt", "rw").getChannel();
MappedByteBuffer mbb = channel.map(FileChannel.MapMode.READ_WRITE, 0, count * 8);
mbb.order(ByteOrder.nativeOrder());

long start = System.nanoTime();
for (int i = 0; i < count; i++) {
    long l = i;
    mbb.putLong(l);
}
channel.close();
long time = System.nanoTime() - start;
System.out.printf("Took %.3f seconds to write %,d longs%n",
        time / 1e9, count);

// Only works on Sun/HotSpot/OpenJDK to deallocate buffer.
((DirectBuffer) mbb).cleaner().clean();

final FileChannel channel2 = new RandomAccessFile("abc.txt", "r").getChannel();
MappedByteBuffer mbb2 = channel2.map(FileChannel.MapMode.READ_ONLY, 0, channel2.size());
mbb2.order(ByteOrder.nativeOrder());
assert mbb2.remaining() == count * 8;
long start2 = System.nanoTime();
for (int i = 0; i < count; i++) {
    long l = mbb2.getLong();
    if (i != l)
        throw new AssertionError("Expected "+i+" but got "+l);
}
channel.close();
long time2 = System.nanoTime() - start2;
System.out.printf("Took %.3f seconds to read %,d longs%n",
        time2 / 1e9, count);

// Only works on Sun/HotSpot/OpenJDK to deallocate buffer.
((DirectBuffer) mbb2).cleaner().clean();

在我的 3.8 GHz i7 上打印。

Took 0.568 seconds to write 220,000,000 longs

在较慢的机器上打印

Took 1.180 seconds to write 220,000,000 longs
Took 0.990 seconds to read 220,000,000 longs

Is here any other way not to create that ? Because I have that array already on my main memory and I can't allocate more than 500 MB to do that?

这不会使用少于 1 KB 的堆。如果您查看此调用前后使用了多少内存，您通常会发现根本没有增加。

Another thing, is this gives efficient loading also means MappedByteBuffer?

根据我的经验，使用内存映射文件是迄今为止最快的，因为您减少了系统调用和复制到内存中的次数。

Because, in some article I found read(buffer) this gives better loading performance. (I check that one, really faster 220 million int array -float array read 5 seconds)

我想读那篇文章，因为我从未见过。

Another issue: readLong gives error while reading from your code output file

证明中的部分性能是以 native 字节顺序存储值。 writeLong/readLong 始终使用 big endian 格式，这在 Intel/AMD 系统上要慢得多，这些系统本身就是 little endian 格式。

您可以使字节顺序为大端字节序，这会减慢它的速度，或者您可以使用 native 排序(DataInput/OutputStream 仅支持大端字节序)

关于磁盘上的 Java 数组批量刷新，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10127455/

25

4

0

文章推荐： android - 向上导航和保存的实例数据

文章推荐： java - 我们如何在 Android 中动态更改 android 应用程序图标

文章推荐： android - SurfaceView 显示黑屏 - Android

文章推荐： java - 如何比较哈希表中的值或键？

java - hibernate 批量更新后清除 session 、刷新、刷新？
我们知道，当使用 hibernate 对数据库进行批量更新时(即使在 HQL 中)，所做的更改不会复制到存储在当前 session 中的实体。所以我可以调用 session.refresh 来加载对
Selenium 刷新
我正在做一个项目，所有的东西都保存在事件中，所以服务器需要一些时间来响应新数据。我正在使用 Fluent 等待使用 ajax 的页面，但是这个不使用任何 ajax。所以我想刷新页面检查是否有新项目，如
刷新 Jtable
我有一个从 Vector 创建的 JTable。如何刷新 JTable 以显示添加到 Vector 的新数据？最佳答案当 TableModel 发生更改时，您的 JTable 应该会自动更新。我
JavaScript 刷新
有没有办法使用下面的代码来刷新已经存在的 div id，而不是刷新时间？ window.onload = startInterval; function startInterval() {
刷新 Shiny 的数据集
我更新了在 Shiny Server 上运行的 Shiny 应用程序使用的 DataSet.RData。但是， Shiny 的应用程序仍在旧数据上运行。我已通过浏览器历史记录清除并重新启动浏览器几次，
无限滚动网格面板的 ExtJs 刷新
我的应用程序中有一个无限滚动的网格面板(ExtJs 4.2.1)，类似于 this example .用户可以单击刷新按钮，然后必须使用数据库中的数据更新网格的行。我在刷新按钮处理程序中调用 stor
delphi - 刷新、更新和重画之间有什么区别？
我不知道这三种方法中哪一种最适合我。他们都为我工作。有谁知道刷新、更新和重画之间的区别吗？最佳答案根据在线文档: Refresh - 重新绘制屏幕上的控件。 Call Refresh method
WPF ICollectionView 刷新
有什么办法吗 ICollectionView.Refresh() 或者 CollectionViewSource.GetDefaultView(args.NewValue).Refresh(); 在
javascript - 更改查询字符串而不重新加载/刷新
这个问题已经有答案了: Updating address bar with new URL without hash or reloading the page [duplicate] (4 个回答)
javascript - setTimeout 刷新
我有一个 javascript 设置超时以在 10 秒后关闭 div，并且我想在 div 关闭时添加页面刷新。我正在使用的代码如下。 var container_close_sec = "1
php - 在多个页面之间循环(刷新)？
我有一组具有以下名称的页面.... update1.php update2.php update3.php update4.php update5.php update6.php update7.ph
php - 刷新/提交后保持选中状态的复选框以及
如果是则触发js函数。我可以使一个复选框保持选中状态，并在页面刷新时检查值并选中“checked”，并提交以下内容... checked="checked" /> 你都不记得触发js函数。这是我的
Javascript div 刷新
我正在尝试刷新 php 脚本以在数据库更新时显示更新的内容。我首先构建了我的 php，然后刷新代码，然后合并它们。但是，脚本不会更新。有谁知道为什么吗？ $(document).ready
hibernate - 如何使域实例关联无效/刷新？
当我要删除的节点扩展集合类型时，Grails中有一个错误阻止我使用removeFrom *。直接从关联中删除节点不会更新二级缓存。 A hasMany B 有什么方法可以使关联缓存手动无效或强制重新加
java - hibernate 刷新？
我正在使用 hibernate 和 mysql 来抽象一个数据库，以便在 java 驱动的网站中使用。我使用 hibernate 很好地解决了所有查询，但似乎无法弄清楚如何使用它进行更新、插入和删除，
java - 刷新 fragment
如何通过调用 oncreateview 方法重新创建 fragment ？我有一个 fragment ，用于通过表单插入新数据，单击按钮后，我想通过删除在 EditText 中输入的数据来重新创建 f
iphone - 刷新 View
当我从一个到另一个时，我试图刷新我的观点。我知道我应该将刷新代码放在 viewWillAppear 中，但我不知道该放什么代码。你们能帮帮我吗？谢谢! 最佳答案在您看来，请调用 setNeeds
flush - NSOutputStream 刷新
我正在开发 iPhone 应用程序并希望使用: CFStreamCreatePairWithSocketToHost(NULL, url, port, &serverReadStream, &serv
PHP session 刷新!
看到我已经创建了一个用于登录用户的脚本。而且我还添加了设置选项卡，以便用户可以编辑他们的设置!但是当我尝试它时，mysql 表中的数据发生了变化，但配置文件中显示的用户名和用户电子邮件保持不变!当我注
javascript - 在没有本地存储的情况下存储数据或只执行一次操作(刷新)
好的。这就是它的样子。当我启动应用程序时，我从服务器收到的第一件事是数据: {name: "test", type: "checkbox" checked: true, } 这使得其中一个复选框

首页

博学

6Ren·AI

商城

磁盘上的 Java 数组批量刷新