gpt4 book ai didi

python - 从 Python 运行 pdftotext

转载 作者:可可西里 更新时间:2023-11-01 10:34:48 29 4
gpt4 key购买 nike

我正在尝试使用 pdftotext 软件将 pdf 文档转换为文本文档。

我需要从 python 脚本调用此应用程序 inc 命令提示符来转换文件。

我有以下代码:

import os 
import subprocess

path = "C:\\Users\\..."
pdffname = "pdffilename.pdf"
txtfname = "txtfilename.txt"

subprocess.call(['pdftotext', '-layout',
os.path.join(path, pdffname),
os.path.join(path, txtfname)])

当我运行这段代码时,出现错误

  File "C:/Users/.../code-1.py", line 44, in <module>
os.path.join(path, txtfname)])

File "C:\Anaconda\lib\subprocess.py", line 522, in call
return Popen(*popenargs, **kwargs).wait()

File "C:\Anaconda\lib\subprocess.py", line 710, in __init__
errread, errwrite)

File "C:\Anaconda\lib\subprocess.py", line 958, in _execute_child
startupinfo)

WindowsError: [Error 2] The system cannot find the file specified

你能帮忙从 python 调用 pdftotext 应用程序将 pdf 转换为文本文件吗?

最佳答案

我有同样的错误,除了 Popen。我通过在子进程调用中提供 pdftotext.exe 的完整路径来修复它。不要忘记转义反斜杠。

我对 Anaconda 了解不多,我自己也没有测试过,但我相信 Conda 在 Windows 上引用脚本可能有问题:fix references to scripts on windows

关于python - 从 Python 运行 pdftotext,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33297936/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com