gpt4 book ai didi

linux - PDF 转文本(多页)

转载 作者:太空宇宙 更新时间:2023-11-04 05:50:53 28 4
gpt4 key购买 nike

如何从多页 PDF 中提取文本?我需要将每个页面作为分隔的文本字符串

第 1 页作为一个字符串,第 2 页作为另一个字符串等

pdftotext 可以吗?或者任何其他工具?

我需要一个 Linux 命令行工具

最佳答案

最简单的方法是使用已命名的 pdftotext 工具,可以通过运行 sudo apt-get install poppler-utils 来安装该工具。之后,您只需运行pdftotext/link/to/input.pdf/link/to/output.txt即可。

关于linux - PDF 转文本(多页),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38315334/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com