gpt4 book ai didi

php - 我如何以编程方式打开一个 docx 文件,对其进行编辑,然后在不破坏的情况下再次密封它?

转载 作者:搜寻专家 更新时间:2023-10-31 21:11:39 25 4
gpt4 key购买 nike

<分区>

我有一个 Web 应用程序,可以使用 LibreOffice 将 Microsoft Word 文档转换为 html。一切都运行良好,但我在解释某些文件缩进的能力方面遇到了一些问题。

根据其他开发人员的建议,我发现了如何通过将 docx 文件转换为 zip、解压缩,然后提取 document.xml 文件来拆分 docx 文件。在此过程中,我注意到 LibreOffice 始终无法解释任何 <w:tab>标签并将它们呈现为缩进。

我已经尝试了很多方法来解决这个问题,但我的想法已经用完了。我最后的努力是使用 php 以编程方式替换所有 <w:tab>带有 <w:ind> 的标签标签(LibreOffice 成功地将其解释为选项卡)。但是,一旦我使用 bash 将文件转换为 .zip,我就无法将其密封为 docx。我的意思是,我可以做到,但 LibreOffice 不再识别它并向我抛出一个奇怪的错误。

有什么方法可以通过拉取 document.xml 文件来获得 html 呈现?如果没有,有谁知道如何将这些文件重新密封备份?任何帮助深表感谢。谢谢!

这是一个更新:当我尝试将 docx 压缩备份时,它似乎包含了父目录。当我将文件转换回 docx 格式时,我认为这会弄乱文件。我似乎无法弄清楚如何在不压缩文件夹的情况下压缩文件夹的所有内容。有任何想法吗?这是到目前为止的代码:

cp mydoc.docx mydoc.zip
unzip -d mydoc mydoc.zip
zip -r my_edited_doc mydoc/*

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com