gpt4 book ai didi

python - 您是否可以仅修改 XML 文件中的文本字符串并仍然保持 .docx 封装的完整性和功能?

转载 作者:太空宇宙 更新时间:2023-11-04 05:48:11 25 4
gpt4 key购买 nike

我想将数据输入到 Microsoft Excel 电子表格中,并让该数据进行交互并将其自身写入其他文档和网络表单。

成功后,我使用 xlwings 从 Excel 电子表格中提取数据。现在,我一直在处理 .docx 文件。这里的目标是将 Excel 数据写入 Microsoft Word .docx 文件模板的特定部分并创建一个新文件。

我的具体问题是:

您能否只修改 word/document.xml 文件中的一个或多个文本字符串,并仍然保持其 .docx 封装的完整性和功能?似乎在对 Word 文档进行哪怕是最细微的更改时,XML 代码中的许多内容都会发生变化。我一直在使用 python-docx 和 lxml,但我不确定我想做的事情是否可以通过这条路线实现。

如果有任何建议或经验可以分享,我们将不胜感激。我觉得我已经阅读了每篇通过谷歌搜索很容易找到的文章至少 5 次。

如果有任何需要澄清的地方,请告诉我。

一些注意事项:我大约 2 个月前开始接触编码。那段时间我一直在集中学习,我觉得我正在掌握基本概念,但我的知识存在严重差距。

这是我的工具:优胜美地 10.10,适用于 Mac 的 Microsoft Office 2011

最佳答案

您可能需要更具体一些,但原则上简短的回答是肯定的。

在某种程度上,python-docx 所做的只是修改 XML 中的字符串。不过有几件事:

  • 您创建的 XML 需要根据架构保持格式正确和有效。因此,如果您更改 <w:t> 中包含的文本元素,例如,它工作正常。相反,如果您在其中一个 .xml 部分的任意点注入(inject)一堆随机 XML,则会损坏文件。

  • 构成 .docx 文件的 XML"file"(称为部分)包含在称为 的 Zip 存档中。您必须正确解包并重新打包该组部件,以便之后获得有效的 .docx 文件。 python-docx会为您处理所有这些细节,但如果您直接访问 .docx 文件,则需要自己处理。

关于python - 您是否可以仅修改 XML 文件中的文本字符串并仍然保持 .docx 封装的完整性和功能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31346625/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com