java-8 - 来自 File.lines() 的并行流的内存使用情况-6ren

java-8 - 来自 File.lines() 的并行流的内存使用情况

转载作者：行者123 更新时间：2023-12-05 01:44:56

38

4

我正在使用 Files.lines() 从大文件 (8GB+) 中读取行。如果按顺序处理，效果很好，内存占用非常低。一旦我将 parallel() 添加到流中，它似乎就会永久卡在它正在处理的数据上，最终导致内存不足异常。我相信这是 Spliterator 在尝试拆分时缓存数据的结果，但我不确定。我剩下的唯一想法是编写一个带有 trySplit 方法的自定义 Spliterator，该方法剥离少量数据进行拆分，而不是尝试将文件分成两半或更多。有没有其他人遇到过这个？

最佳答案

通过代码追踪我猜是 Spliterator被 Files.lines() 使用是Spliterators.IteratorSpliterator .谁的trySplit()方法有这样的评论:

        /*
         * Split into arrays of arithmetically increasing batch
         * sizes.  This will only improve parallel performance if
         * per-element Consumer actions are more costly than
         * transferring them into an array.  The use of an
         * arithmetic progression in split sizes provides overhead
         * vs parallelism bounds that do not particularly favor or
         * penalize cases of lightweight vs heavyweight element
         * operations, across combinations of #elements vs #cores,
         * whether or not either are known.  We generate
         * O(sqrt(#elements)) splits, allowing O(sqrt(#cores))
         * potential speedup.
         */

然后代码看起来像是分成了 1024 条记录(行)的倍数的批处理。所以第一个拆分将读取 1024 行，然后下一个拆分将读取 2048 行等等。每个拆分将读取越来越大的批量大小。

如果您的文件真的很大，它最终会达到最大批处理大小 33,554,432，即 1<<25 .请记住，这是行而不是字节，这可能会导致内存不足错误，尤其是当您开始让多个线程读取那么多时。

这也解释了减速的原因。在线程可以处理这些行之前提前读取这些行。

所以我要么不使用 parallel()完全或者如果你必须这样做，因为你正在做的计算每行都很昂贵，请编写你自己的 Spliterator，它不会像这样 split 。可能总是使用一批 1024 就可以了。

关于java-8 - 来自 File.lines() 的并行流的内存使用情况，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44034978/

38

4

0

文章推荐： selenium - 将 Testng 与 cucumber 一起使用有什么好处吗？

文章推荐： applescript - 在 applescript 中将应用程序设置为最前面

文章推荐： php - Laravel 使用软删除显示关系数据

sql - 查询以处理单个参数以及 "All"情况
我正在创建一个 sql server 存储过程，它将输入作为逗号分隔的 productid 或选项“全部”。当用户传入逗号分隔的产品 ID 时，查询应输出所有产品 ID 的数据。我使用“IN”语句执行
scala - 模式匹配中的大量嵌套匹配...情况
我有一个自动生成的 Web 服务客户端。我有很多复杂的类，我必须对其进行模式匹配。现在我的结构如下所示: val response = client.getResponse response matc
声明全局变量的 Javascript 情况？
关闭。这个问题是opinion-based .它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 7年前关闭。 Improve this
sql - TSQL where 情况
我需要正确的 tsql 语法来解决这个问题: Select * from table where var_A='10' select * from table where var_B='10' 何时使
c - 尝试读取结构元素时的 if 情况
我遇到了这个问题。每当我运行程序并在需要时键入字母 m 时，我的 if 语句都不会识别它。有人知道为什么吗？我已经这样做了一个小时，但没有结果。 #include #include #includ
php - 为表格的特定行赋予颜色。情况
我从数据库列名称“你有护照”创建了一个表，用户回答是或否我如何将 css 应用到这个动态工作的表。 table, th, td { border: 1px solid black;
android - onStatusChanged 情况
我对 LocationListener 类的 onStatusChanged 有一些疑问。它知道它可以呈现三种状态:AVAILABLE、TEMPORARILY_UNAVAILABLE 和 OUT_O
delphi - 您如何命名和组织您的异常(exception)情况？
当引入新的异常类型时，我总是不确定如何正确地做到这一点。有共同约定吗？你怎么做呢？我对您组织它们的范围感兴趣(将它们保留在它们所使用的单元中？在组件级别有一个单元？包级别？应用程序？) 这也会影响命
sql - 营业时间逻辑和营业时间的异常(exception)情况
我使用以下内容创建了日期维度: https://www.codeproject.com/Articles/647950/Create-and-Populate-Date-Dimension-for-D
javascript - 如何全面查询类(class)情况？
您好，我正在使用 Android 完全 Kiosk 浏览器，该浏览器使用 chrome Webview。但是 javascript 中的某些方法或函数无法正常工作，例如 window.print()。
c# - 我应该处理哪些异常(exception)情况
我有以下代码: public void OpenFile(string FileName) { if (FileName == null)
java - 比较数据的异常(exception)情况
获取索引越界异常 for (int recordData = 0; recordData < recordDataList.size(); recordData++) {
JSF 渲染弹出窗口出现 manegbean 情况？
我使用它在发生错误时在登录中显示一条消息: × Invalid user or password
java - 比较异常(exception)情况
这是我的场景，我有一个异常列表，其中包含来自不同层次结构的任意异常，下面的代码快照将解释我需要做什么 private List connectionExceptions; try { // tryin
java - JTextPane 动态缩进!!!情况
我尝试动态更新 Jtextpane 中的左缩进。但我不能!这是我尝试过的! DefaultStyledDocument document = (DefaultStyledDocument) textp
java - 异常(exception)情况
我不知道为什么这个异常不起作用...... import java.util.*; public class a { public static void main(String[] args
mysql - MySQL 中联接内的多个 When 情况
我目前在 case 中使用多个 when 时遇到问题。当我删除第二个当时，它就起作用了。这是什么问题？报告的MYSQL错误为: #1064 - You have an error in your S
mysql - SQL:使用单个查询计算不同的 where 情况
例如，我有一个表记录用户查看和下载文件的事件， file_id user activity 2 Tim view 1 Ron
c++ - 令人困惑的 C++ 情况
这是一个非常愚蠢的问题，但我需要一点安慰/帮助。我有当前的“递归”情况: void add( int value ) { // do something ... // if ( conditi
javascript - 如何摆脱javascript中的绑定(bind)情况
我尝试使用以下代码在按钮数组上注册回调。但我似乎无法理解如何绑定(bind)回调中需要的字符串。任何建议将不胜感激! for (var i = 0; i < this.car_types.length

首页

博学

6Ren·AI

商城

java-8 - 来自 File.lines() 的并行流的内存使用情况