gpt4 book ai didi

php - 在 PHP 中读取 docx(Office Open XML)

转载 作者:可可西里 更新时间:2023-11-01 12:25:46 26 4
gpt4 key购买 nike

我想在我们的 CMS 中添加一个 word 导入功能,唯一的问题是我找不到一个好的库来读取 docx 文件 (Word 2007)。

有没有人有一些建议,图书馆应该能够提取文档的内容和基本样式,如斜体、粗体、上标?

谢谢你的帮助

最佳答案

docx 文件实际上只是文档 XML 的容器。您应该能够解压缩 docx 文件,然后转到里面的 word 文件夹,然后转到 document.xml。这有实际的文字。但是诸如字体和样式之类的东西位于 docx 容器中的其他 xml 文件中,因此您可能想要稍微弄乱一下并弄清楚什么是什么以及如何匹配它(我打赌首先使用 namespace )。

但是,是的,解压缩文件,然后使用 simplexml 将其转换为您实际上可以随意使用的东西。

关于php - 在 PHP 中读取 docx(Office Open XML),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1501623/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com