gpt4 book ai didi

Python 将 doc 转换为 docx

转载 作者:太空宇宙 更新时间:2023-11-04 04:59:07 25 4
gpt4 key购买 nike

我正在尝试将 doc 文件转换为 docx。我在网上找到了这段代码。

subprocess.call(['soffice', '--headless', '--convert-to', 'docx', filename])
document = docx.Document(path[:-4] + ".docx")
docText = ''.join([
paragraph.text.encode('ascii', 'ignore') for paragraph in
document.paragraphs

我在自己的机器上使用它时效果很好,但我正在尝试将它放在 AWS 上。它在那里不起作用。我收到一条错误消息“没有这样的文件或目录”。

可能是什么原因导致它在我的电脑上可以运行,但当我将它放在 AWS 上时却不行。

最佳答案

您必须在使用此代码的机器上安装 LibreOffice,并且在运行此代码之前必须关闭打开的 LibreOffice 实例,否则它会静默退出而不执行任何操作。你也可以试试

unoconv -d document --format=docx *.doc

但它也依赖于 LibreOffice。它将通过 LibreOffice 转换文件。它不完善,丢失了一些格式,但它会将所有 doc 文件转换为 docx

关于Python 将 doc 转换为 docx,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46296014/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com