gpt4 book ai didi

r - 从pdf中提取评论

转载 作者:行者123 更新时间:2023-12-04 11:53:25 25 4
gpt4 key购买 nike

我有一组 .pdf 文件,其中包含在 Adob​​e Acrobat 中添加的注释。我希望能够分析这些评论,但我有点坚持提取它们。我查看了 pdftools 包,但它似乎只能提取文本而不能提取注释。是否有一种方法可用于提取 R 中的注释?

最佳答案

PyMuPDF ( https://pymupdf.readthedocs.io/en/latest/ ) 是我发现工作的唯一 python 库。
在基于 Debian/Ubuntu 的发行版中安装:

apt-get install python3-fitz
脚本:
import fitz
doc = fitz.open("example.pdf")
for i in range(doc.pageCount):
page = doc[i]
for annot in page.annots():
print(annot.info["content"])

关于r - 从pdf中提取评论,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50801270/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com