gpt4 book ai didi

python - 有什么方法可以通过 Python 突出显示给定单词的 pdf 文档?

转载 作者:太空宇宙 更新时间:2023-11-03 11:53:53 24 4
gpt4 key购买 nike

我之前得到了一些关键字,我想通过 python 在 pdf 文档上搜索并突出显示它们。它是否适用于像 pdfMiner 这样的库?

最佳答案

是的,您可以使用“PyMuPDF”库。pip 安装 PyMuPDF。

然后使用下面的代码,

import fitz

### READ IN PDF

doc = fitz.open(r"D:\XXXX\XXX.pdf")
page = doc[0]

text = "Amey"
text_instances = page.searchFor(text)

### HIGHLIGHT

for inst in text_instances:
print(inst, type(inst))
highlight = page.addHighlightAnnot(inst)


### OUTPUT

doc.save(r"D:\XXXX\XXX.pdf", garbage=4, deflate=True, clean=True)

关于python - 有什么方法可以通过 Python 突出显示给定单词的 pdf 文档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18690126/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com