gpt4 book ai didi

java - Java 中的文件流

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:50:56 25 4
gpt4 key购买 nike

我目前正在使用 JOGL(Java OpenGL 绑定(bind))开发 3D 图形应用程序。简而言之,我有一个巨大的横向二进制文件。由于它的大小,我必须在运行时流式传输地形 block 。因此,我们明确地看到了随机访问问题。我已经完成了第一个(和肮脏的 :))实现(也许它是多线程的),我正在使用一种愚蠢的方法......这是它的初始化:

dataInputStream = new DataInputStream(new BufferedInputStream(fileInputStream,4 * 1024);
dataInputStream.mark(dataInputStream.available());

当我需要读取(流式传输)特殊 block (我已经知道它在文件中的“偏移量”)时,我正在执行以下操作(真丢人:)):

dataInputStream.reset();
dataInputStream.skipBytes(offset);
dataInputStream.read(whatever I need...);

由于我没有什么经验,所以我首先想到的是 :)所以,到目前为止,我已经阅读了 3 篇有用且非常有趣的文章(我建议您阅读它们,如果您对此主题感兴趣的话)

  1. Byte Buffers and Non-Heap Memory - Gregory 先生似乎精通 Java NIO。

  2. Java 技巧:如何快速读取文件 [http://nadeausoftware.com/articles/2008/02/java_tip_how_read_files_quickly] - 这是一个有趣的基准测试。

    <
  3. 文章:调整 Java I/O 性能 [http://java.sun.com/developer/technicalArticles/Programming/PerfTuning/] - 简单的 Sun 建议,但请向下滚动看看那里的“随机访问”部分;他们展示了具有自缓冲改进功能的 RandomAccessFile (RAF) 的简单实现。

先生。 Gregory 在他的文章末尾提供了几个 *.java 文件。其中之一是 FileChannel + ByteBuffer + Mapping (FBM) 和 RAF 之间的基准测试。他说,与 RAF 相比,他注意到使用 FBM 时速度提高了 4 倍。我在以下条件下运行了这个基准测试:

  1. 偏移量(例如访问位置)是随机生成的(在文件范围内,例如 0 - file.length());
  2. 文件大小为 220MB;
  3. 1 000 000 次访问(75% 读取和 25% 写入)

结果令人震惊:

~ 英国皇家空军 28 秒!~ FBM 0.2 秒!

但是,他在此基准测试中实现的 RAF 没有自缓冲(第 3 篇文章讲述了一个),所以我猜是“RandomAccessFile.seek”方法调用导致性能下降如此严重。

好吧,在我学到了所有这些东西之后,现在有 1 个问题和 1 个困境:)

问题:当我们使用“FileChannel.map”映射文件时,Java 是否将整个文件内容复制到 MappedByteBuffer 中?还是只是模仿它?如果它复制,那么使用 FBM 方法不适合我的情况,是吗?

困境:取决于你对问题的回答......

  1. 如果映射复制一个文件,那么我似乎只有 2 个可能的解决方案:RAF + self-buffering(第 3 篇文章中的那个)或ma​​ke在 FileChannel 中使用位置(不使用映射)...哪个更好?

  2. 如果映射不复制文件,那么我有 3 个选项:前两个选项和 FBM 本身

编辑:这里还有一个问题。你们中的一些人说映射不会将文件复制到 MappedByteBuffer 中。好吧,为什么我不能映射 1GB 的文件,我收到“映射失败”的消息...

P. S. 我希望得到一个完整的答案和建议,因为我无法在互联网上找到关于这个主题的一致信息。

谢谢:)

最佳答案

不,数据没有被缓冲。 MappedByteBuffer 使用 pointer 引用数据.换句话说,数据不会被复制,它只是映射到物理内存中。查看API docs如果您还没有。

A memory-mapped file is a segment of virtual memory which has been assigned a direct byte-for-byte correlation with some portion of a file or file-like resource. This resource is typically a file that is physically present on-disk, but can also be a device, shared memory object, or other resource that the operating system can reference through a file descriptor. Once present, this correlation between the file and the memory space permits applications to treat the mapped portion as if it were primary memory.

来源:Wikipedia

如果您要非常频繁地读取数据,最好至少缓存一些数据。

关于java - Java 中的文件流,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4728523/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com