gpt4 book ai didi

c# - 从 WORD 打开 XML 中删除空白页

转载 作者:行者123 更新时间:2023-11-30 18:37:46 27 4
gpt4 key购买 nike

我已经成功地使用open XML生成了一个word文档文件,但是我的空白页太多了,我怎样才能删除它们?

最佳答案

这取决于这些空白页在 Open XML 中的表示方式;您可能想发布一个示例文档来准确演示您的空白页是如何表示的。

但让我们以 Word 文档为例,用户在其中插入了额外的分页符(通过在 Word 中按 ctrl-enter),导致出现空白页面。这些分页符将在 XML 中表示为:

<w:br w:type="page"/>  

页面中仍然有大量用于间距、字体等的标签;页面也可能显示页眉和页脚。但是让我们将空白页定义为没有新段落文本的页面。在 Open XML 中,新文本显示时带有 w:t 标签。

因此,为了删除中间没有文本的额外分页符创建的空白页,我们可以在 XML 文档上运行以下正则表达式,替换为空白 (""):

<w:br w:type="page"/>(.(?!<w:t>))*(?=<w:br w:type="page"/>)

此正则表达式将搜索一系列两个或多个分页符,中间没有新文本,删除除最后一个以外的所有分页符。

(请注意,这不会处理文档末尾的空白页,这有点棘手。此外,如果您想考虑包含图像、文本框等的页面,正则表达式将必须扩展以包括相关项目)。

关于c# - 从 WORD 打开 XML 中删除空白页,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12266063/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com