gpt4 book ai didi

docker - 如何在 libreoffice 6.4 中将 pdf 转换为 docx?

转载 作者:行者123 更新时间:2023-12-04 16:39:38 24 4
gpt4 key购买 nike

我的 ubuntu 18.04 容器中安装了 libreoffice 6.4。

目标是将pdf文件转换为docx。

我已经尝试过这些命令:

libreoffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to docx:"Microsoft Word 2007-2013 XML" /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to docx:"MS Word 2007 XML" /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to docx:writer_MS_Word_97 /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to "docx:writer_MS_Word_2007" /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to docx:writer_OOXML /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to doc /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to "docx:writer_MS_Word_2007" --outdir /pdf pdf.pdf

但他们总是返回此消息:

convert /pdf/pdf.pdf -> /pdf/pdf.docx using filter : writer_MS_Word_2007
Overwriting: /pdf/pdf.docx
Error: Please verify input parameters... (SfxBaseModel::impl_store <file:///pdf/pdf.docx> failed: 0x81a(Error Area:Io Class:Parameter Code:26))

谁能告诉我发生了什么事?


更新:

我试过这个命令:

libreoffice --infilter="writer_pdf_import" --convert-to docx  --outdir /pdf /pdf/pdf.pdf

它返回了这条消息:

convert /pdf/pdf.pdf -> /pdf/pdf.docx using filter : Office Open XML Text
Overwriting: /pdf/pdf.docx

我可以看到它需要 --infilter-- 参数,因为输入文件是 pdf。

但是,它使用 Office Open XML Text 过滤器,我需要将其切换为 Microsoft Word 2007-2013 XML,我该怎么做?

我已经尝试过这些但没有工作:

libreoffice --infilter="writer_pdf_import" --convert-to docx:"Microsoft Word 2007-2013 XML"  --outdir /pdf /pdf/pdf.pdf

libreoffice --infilter="writer_pdf_import" --convert-to "docx:Microsoft Word 2007-2013 XML" --outdir /pdf /pdf/pdf.pdf

libreoffice --infilter="writer_pdf_import" --convert-to "docx:writer_MS_Word_2007" --outdir /pdf /pdf/pdf.pdf

libreoffice --infilter="writer_pdf_import" --convert-to docx:"writer_MS_Word_2007" --outdir /pdf /pdf/pdf.pdf

libreoffice --infilter="writer_pdf_import" --convert-to docx:writer_MS_Word_2007 --outdir /pdf /pdf/pdf.pdf

他们总是返回这个消息(同上):

convert /pdf/pdf.pdf -> /pdf/pdf.docx using filter : writer_MS_Word_2007
Overwriting: /pdf/pdf.docx
Error: Please verify input parameters... (SfxBaseModel::impl_store <file:///pdf/pdf.docx> failed: 0x81a(Error Area:Io Class:Parameter Code:26))

最佳答案

我终于找到了解决方法。

希望这对遇到相同问题的人有用。

我做了一个实验,从 list 中一一尝试可能的单词过滤器,有 4 次成功尝试。

libreoffice --headless --infilter="writer_pdf_import" --convert-to docx  --outdir /pdf /pdf/pdf.pdf

libreoffice --headless --infilter='writer_pdf_import' --convert-to docx:"MS Word 2007 XML" --outdir /pdf /pdf/pdf.pdf

libreoffice --headless --infilter='writer_pdf_import' --convert-to doc:"MS Word 2007 XML" --outdir /pdf /pdf/pdf.pdf

libreoffice --headless --infilter="writer_pdf_import" --convert-to doc --outdir /pdf /pdf/pdf.pdf

但是在这 4 个命令中,最后一个产生的效果最好,转换后的文档文件内容看起来和原来的差不多,仅供引用,我的文档有一些汉字和表格,前 3 个命令没有绘制表格边框正确,而最后一个边框正确。


更新:

我决定在 ubuntu 18.04 容器上安装 libreoffice 7.0。

要查看过滤器的详细列表,请转到 here ,然后打开其中一个 xcu 文件,过滤器详细信息应该在那里,要使用它,只需从 name 属性中选择,然后像这样使用它:

libreoffice --headless --infilter='writer_pdf_import' --convert-to doc:"<enter_filter_name_here>" --outdir /pdf /pdf/pdf.pdf

关于docker - 如何在 libreoffice 6.4 中将 pdf 转换为 docx?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63593345/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com