gpt4 book ai didi

python - 无法读取使用 soffice 命令转换 pdf 后获得的 .docx 文件

转载 作者:太空宇宙 更新时间:2023-11-03 19:59:20 25 4
gpt4 key购买 nike

我正在尝试使用 soffice 将 pdf 转换为 docx。它将其转换为 .docx,但它提供了我无法使用 docx api 读取的文本框。由Python提供。有没有更好的方法来读取文件或有更好的方法将 pdf 转换为 docx 这样我就不会得到文本框?

soffice --infilter="writer_pdf_import" --convert-to docx "convert_this.pdf"

最佳答案

您可以尝试使用 Aspose.Words for Cloud 将 PDF 转换为 Word 文档。 https://docs.aspose.cloud/display/wordscloud/Convert+PDF+Document+to+Word它将 PDF 从固定格式转换为流动格式,以便可以在 MS Word 中编辑。

披露:我在 Aspose.Words 团队工作。

关于python - 无法读取使用 soffice 命令转换 pdf 后获得的 .docx 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59346156/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com