c# - 如何提高从 OpenXml Excel 电子表格工具中的 SharedStringTable 检索值的性能？-6ren

c# - 如何提高从 OpenXml Excel 电子表格工具中的 SharedStringTable 检索值的性能？

转载作者：太空宇宙更新时间：2023-11-03 21:03:59

26

4

我正在使用 DocumentFormat.OpenXml 读取 Excel 电子表格。我有一个性能瓶颈，用于从 SharedStringTable 对象查找单元格值的代码(它似乎是某种单元格值的查找表):

var returnValue = sharedStringTablePart.SharedStringTable.ChildElements.GetItem(parsedValue).InnerText;

我创建了一个字典来确保我只检索一个值一次:

if (dictionary.ContainsKey(parsedValue))
{
    return dictionary[parsedValue];
}

var fetchedValue = sharedStringTablePart.SharedStringTable.ChildElements.GetItem(parsedValue).InnerText;
dictionary.Add(parsedValue, fetchedValue);
return fetchedValue;

这将执行时间缩短了近 50%。然而，我的指标表明，从 SharedStringTable 对象获取值的代码行执行 123,951 次仍然需要 208 秒。有没有其他方法可以优化此操作？

最佳答案

我会一次性将整个共享字符串表读入您的字典，而不是根据需要查找每个值。这将允许您按顺序移动文件并存储值以供散列查找使用，这将比扫描 SST 以获取您需要的每个值更有效。

在您的流程开始时运行类似以下内容将允许您使用 dictionary[parsedValue] 访问每个值。

private static void LoadDictionary()
{
    int i = 0;

    foreach (var ss in sharedStringTablePart.SharedStringTable.ChildElements)
    {
        dictionary.Add(i++, ss.InnerText);
    }
}

如果您的文件非常大，您可能会看到使用 SAX 方法而不是上面的 DOM 方法来读取文件的一些好处:

private static void LoadDictionarySax()
{
    using (OpenXmlReader reader = OpenXmlReader.Create(sharedStringTablePart))
    {
        int i = 0;
        while (reader.Read())
        {
            if (reader.ElementType == typeof(SharedStringItem))
            {
                SharedStringItem ssi = (SharedStringItem)reader.LoadCurrentElement();
                dictionary.Add(i++, ssi.Text != null ? ssi.Text.Text : string.Empty);
            }
        }
    }
}

在我的机器上，使用一个包含 60000 行和 2 列的文件，使用上面的 LoadDictionary 方法而不是您问题中的 GetValue 方法，速度大约快 300 倍。 LoadDictionarySax 方法提供了类似的性能，但在更大的文件(100000 行，10 列)上，SAX 方法比 LoadDictionary 方法快 25% 左右。在更大的文件(100000 行，26 列)上，LoadDictionary 方法抛出内存不足异常，但 LoadDictionarySax 正常运行。

关于c# - 如何提高从 OpenXml Excel 电子表格工具中的 SharedStringTable 检索值的性能？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42508239/

26

4

0

文章推荐： c# - if else系列如何清理

文章推荐： python - 我该如何制作没有小部件的框架？

文章推荐： c# - 递归方法不会循环 child 的 child

android - 安装了最新的 ADT 和 sdk 工具，但仍然要求提供最新的 sdk 工具
这个问题在这里已经有了答案: Android ADT version required 20.0.0 and above (10 个答案) 关闭 9 年前。我刚刚安装了 Eclipse Juno
Visual Studio 2012 的 Python 工具。工具/选项窗口中缺少 Python
按照 This page from codeplex 上的指南进行操作后，我无法在我的工具/选项窗口中看到 Python 选项。我认为我与指南的唯一偏差是: 发行版:没有安装 activestate
sql-server - 此 T-SQL 脚本超出了允许的最大大小。通过从“工具”菜单中选择“选项”，在“SQL Server 工具”页面中调整此设置
我有一个非常大的 .sql 脚本。我将此脚本添加到 Visual Studio 2013 下的 SQL Server 项目中。当我尝试构建它时，我收到此错误消息 This T-SQL script e
【工具】IDEA怎么查看maven依赖链路？
当我在SpringBoot项目中想加个依赖，但是不确定现有依赖的依赖的依赖.....有没有添加过这个依赖，怎么办呢？如果添加过了但是不知道我需要的这个依赖属于哪个依赖的下面，怎么查呢？ IDEA中提供
PDF压缩库/工具
我正在做一个项目来减少 PDF 的大小，压缩它们。我想知道市场上是否有任何非常好的工具/库(.NET)。我确实尝试了一些像 Onstream Compression 这样的工具，但结果并不令人满意。
自动编译Android内核/工具
我想从我的源代码编译一个安卓内核。但我想使用工具或类似的东西。所以我只需单击一个按钮并获得一个可闪存的 zip 文件... 有工具吗？我可以用脚本来做吗？谢谢! 最佳答案这取决于您从哪里获得
用于简单分布式计算问题的Java框架/工具
我们生成 pdf 文件，其中包含有关数万名客户每月财务余额的数据。在高峰期(年底有 100.000 个文件)，使用在 5 台服务器之间分配负载，该过程可能需要长达 5 天的时间才能完成。工作负载的分配
进一步了解Python中的XML 工具
模块：xmllib xmllib 是一个非验证的低级语法分析器。应用程序员使用的 xmllib 可以覆盖 XMLParser 类，并提供处理文档元素（如特定或类属标记，或字符实体）的方法。从 Py
Maven Lint 工具
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 3 年前。
excel - 用于确定位置之间距离的方法/工具
我在一家医疗保健公司工作，拥有有关患者位置(地址、城市、州、 zip )的信息。我试图确定有多少百分比的患者住在离 5 个特定位置最近的地方。我正在寻找的答案是“25% 的患者住在离#1 地点最近的地
用于解压缩任何文件压缩格式的 Linux 工具
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 4年前关闭。我们不允许在 Stack Overflow 上提出有关通用计算硬件和软件的问题。您可以编辑问
ide - 您多久重新评估和升级一次开发环境和开发人员。工具？
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be
wcf - SvcTraceViewer 工具
请问我在哪里可以得到 SvcTraceViewer 工具？我尝试下载并安装许多 SDK。我查看了程序文件的垃圾箱。我需要它来跟踪我的 WCF 调用出了什么问题。最佳答案您可以通过下载 Win
autocomplete - 通用代码完成库/工具
我正在尝试在我最喜欢的编辑器中设置适当的代码完成功能，我们将其称为AnEditor，以避免互联网上充斥着特定于程序的答案。 (您知道语言是ALanguage。)编辑器具有两个我喜欢的功能:它既可以在控
不允许使用 Orm 工具 : What do you do?
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
Mercurial和 merge 工具？
当 merge 的两个分支对同一文件有更改时，Mercurial 是否总是使用外部 merge 工具？或者它是否首先查看它是否可以 merge 文件本身，如果不能，则仅转向外部工具？我问的原因是我
用于删除所有未使用代码的 Scala 工具
我正在为我使用的编辑器编写 Scala 插件，该插件将突出显示所有未使用的代码路径(可能未使用 defs 、 vals 、 classes 和 implicits )，并为用户提供一个选项以将它们从.
Jquery 工具触摸水平仅禁用垂直触摸
我有 jquery 工具滚动器...我喜欢它只为 swipeLeft swipeRight 实现触摸选项。当我使用 touch: true 时，它也会在向上/向下滑动时旋转.. 我按照此处的说明
Eclipse UML 工具
我已经尝试了一些用于构建 UML(对象/依赖图)的 Eclipse 工具，但我真正需要的是一个工具来生成这样的代码外 UML。 (反之亦然) 我更喜欢一个简单的 UML 工具，它易于安装并且没有任何依
CSS "Normalizer"工具？
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为

首页

博学

6Ren·AI

商城

c# - 如何提高从 OpenXml Excel 电子表格工具中的 SharedStringTable 检索值的性能？