gpt4 book ai didi

perl - 从 pdf 创建索引

转载 作者:行者123 更新时间:2023-12-04 21:49:52 24 4
gpt4 key购买 nike

这个问题在这里已经有了答案:




10年前关闭。




Possible Duplicate:
How do I Index PDF files and search for keywords?



从 PDF 创建索引。

最佳答案

我认为您可以为此使用 pyPdf Python 库(http://pybrary.net/pyPdf/)。
此代码显示包含所需单词的页数:

from pyPdf import PdfFileReader

input = PdfFileReader(file("YourPDFFile.pdf", "rb"))

numberOfPages = input.getNumPages()

i = 1
while i < numberOfPages:
oPage = input.getPage(i)
text = oPage.extractText()
text.encode('utf8', 'ignore')
if text.find('What are you looking for') != -1:
print i
i += 1

相同但使用 Python 3
from pyPdf import PdfFileReader

input = PdfFileReader(open("YourPDFFile.pdf", "rb"))

numberOfPages = input.getNumPages()

i = 1
while i < numberOfPages:
oPage = input.getPage(i)
text = oPage.extractText()
text.encode('utf8', 'ignore')
if text.find('What are you looking for') != -1:
print(i)
i += 1

关于perl - 从 pdf 创建索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6910932/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com