gpt4 book ai didi

python - 如何使用 PDFrw 在 Python 中从 PDF 中提取数据

转载 作者:太空宇宙 更新时间:2023-11-03 12:32:20 26 4
gpt4 key购买 nike

我正在尝试使用 PDFrw 从某个 PDF 中获取数据(比如说页面右上角的那个 HERE )。我正在使用 PDFrw 来执行此操作。我查看了他们提供的文档(我找不到太多)并查看了他们在 git 上发布的示例代码,但我似乎无法获得足够的信息来完成我想做的事情。我将如何制作一个简单的程序来使用 PDFrw(如果有更好的程序,则使用另一个程序)进入 PDF 并提取一段文本。我正在考虑将其转换为 html...那会更容易吗?以我上面提供的 PDF 为例,我想获得(比方说)电压,PDF 中的电压为 600 w...我将如何以最简单的方式执行此操作?我找不到关于此的任何其他堆栈溢出问题,所以希望有人可以帮助以前使用过它的人!

谢谢!

最佳答案

我是 pdfrw 的作者,它并不是真正为此而设计的。您可能应该看看 pdfminer。

关于python - 如何使用 PDFrw 在 Python 中从 PDF 中提取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31414157/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com