用于比较 Excel 工作表的 Java 代码不适用于较大的文件-6ren

用于比较 Excel 工作表的 Java 代码不适用于较大的文件

转载作者：行者123 更新时间：2023-12-02 00:32:08

我最近用 java 完成了一个项目，用于比较 2 个不同文件夹中的 Excel 工作表，并在源文件夹目录中创建的摘要文件夹中生成结果。除了超过 10000 行的文件外，所有代码都工作正常。它只是创建一个空表，而不是比较较大文件的不匹配情况。这是我使用的代码请帮助我。

    package com.validation.comparators;
    import java.util.ArrayList;
    import java.util.List;
    import org.apache.commons.lang3.StringUtils;
    import org.bson.Document;
    /**
      * The utility class SheetComparator
   */
    public class SheetComparator {
    private SheetComparator() {
    // The utility class
}

/**
 * Compares the document equivalent of two sheets
 * 
 * @param document1
 *            The document 1
 * @param document2
 *            The document 2
 * @return The compared output
 */
@SuppressWarnings("unchecked")
public static Document compare(Document document1, Document document2) {

    List<String> headers = (List<String>) document1.get("headers");
    List<Document> sheet1Rows = (List<Document>) document1.get("data");
    List<Document> sheet2Rows = (List<Document>) document2.get("data");
    List<Document> temp;
    List<Document> comparedOutput = new ArrayList<>();

    if (sheet1Rows.size() < sheet2Rows.size()) {
        temp = sheet1Rows;
        sheet1Rows = sheet2Rows;
        sheet2Rows = temp;
    }

    int length = sheet1Rows.size();
    int length2 = sheet2Rows.size();

    for (int i = 0; i < length2; i++) {
        Document sheet1Row = sheet1Rows.get(i);
        Document sheet2Row = sheet2Rows.get(i);
        Document comparedRow = new Document("row number",
                new Document("value", sheet1Row.getString("row number")).append("color", "WHITE"));
        Boolean completeMatch = true;

        for (String header : headers) {
            Boolean isNull = false;
            String value1 = sheet1Row.getString(header).trim();
            String value2 = sheet2Row.getString(header).trim();

            if (StringUtils.isAnyBlank(value1, value2)) {
                completeMatch = false;
                isNull = true;
            } else if (!StringUtils.equals(value1, value2)) {
                completeMatch = false;
            }

            if (isNull) {
                comparedRow.append(header, new Document("value", StringUtils.isBlank(value1) ? value2 : value1)
                        .append("color", "RED"));
            } else {
                comparedRow.append(header, new Document("value", value1).append("color", "WHITE"));
            }
        }

        if (!completeMatch) {
            comparedOutput.add(comparedRow);
        }
    }

    for (int i = length2; i < length; i++) {
        Document row = sheet1Rows.get(i);
        Document comparedRow = new Document();

        for (String header : headers) {
            String value = row.getString(header);
            comparedRow.put(header, new Document("value", value).append("color", "RED"));
        }

        comparedRow.append("row number",
                new Document("value", row.getString("row number")).append("color", "WHITE"));
        comparedOutput.add(comparedRow);
    }

    headers.add(0, "row number");
    return new Document("data", comparedOutput).append("headers", headers);
}
}

最佳答案

尝试一下，将 jvm (java) 内存设置得较高。问题是您必须读取整个 DOM 对象层次结构。

否则您只需按表、按行、按单元格顺序读取文档。因此，您可以:

，而不是在内存中保留一些 DOM 对象

将文档的顺序流(作为文本文档)写入文件。
将两个 Excel 转换为文本。
读取两个流并对每个标记进行比较。
也许您可以立即编写差异报告。

关于用于比较 Excel 工作表的 Java 代码不适用于较大的文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58005311/

文章推荐： mongodb 如何将 mongodump 仅索引到另一个 mongodb 实例

文章推荐： list - 如何递归地请求输入并返回列表

文章推荐： wpf - DataTrigger 的 EnterAction/ExitAction 动画冲突

PHP 插入 - 首次输入的 UID 较大
我正在通过 PHP 将 .csv 中的两行插入到表中。我还会跟踪任何错误，如果发生错误，我不会提交事务。插入表后，我检索结果行的 ID(全部在一个事务中提交)，并且 csv 的第一行对应于第二个 I
java - 每个应用程序一个(较大)线程池与每个应用程序组件多个(较小)线程池
一个应用程序托管一个具有三个接口(interface)的 Web 服务，用于三个单独且独立的操作，所有这些操作都在应用程序的不同组件中实现，彼此独立，例如在不同的包等中，所以他们对彼此了解不多，只共享
javascript - 由于文档准备好且 DOM 较大，jquery 点击触发速度非常慢
我希望在单击特定表格数据单元格时同时选中单选按钮和单选按钮单击事件。我已经使用以下方法实现了这一点: $(document).ready(function() { $("td").click(
html - 向内部 div 添加边距时，较大 div 内定义宽度的 Div 元素会溢出
JSFiddle:https://jsfiddle.net/oyp1zxaq/ 本质上，我只是想在较大的 div 中放置四个具有定义宽度的较小 div，但我希望它们在其中间隔开。我想知道是否有一种方
android - MATCH_PARENT 如果兄弟 View 较大，WRAP_CONTENT 如果兄弟 View 较小
我在一个布局中有两个 View 。我将分别称它们为 View A 和 View B。 ┌──────┐ │┌─┐┌─┐│ ││A││B││ │└─┘└─┘│ └──────┘ 父布局(包括View A

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

用于比较 Excel 工作表的 Java 代码不适用于较大的文件