gpt4 book ai didi

python - 在 Python 中查找、删除文本并将其添加到 pdf 文件中

转载 作者:行者123 更新时间:2023-12-03 20:51:00 25 4
gpt4 key购买 nike

我有一个pdf文件,需要删除其中的某些文本。然后将下面的新文本添加到现有文本中。
我正在尝试使用 PyMuPDF library - fitz .打开文件,将文本设置为搜索,但我没有找到如何删除它并添加新文本。
请您帮我如何删除找到的文本并添加到现有文本中。
使用库并不重要,我们可以使用 PyPDF2 等。
带有描述的示例 pdf 文件是 attached .

import fitz

doc = fitz.open(MyFilePath)
page = doc[0]

text1 = “ANA”
text_instances1 = page.searchFor(text1)

# found text should be deleted …

text_to_add = “Text”
text2 = “TAIL NO.”
text_instances2 = page.searchFor(text2)

# should be added "text_to_add" after found text "text2"

doc.save(OutputFilePath, garbage=4, deflate=True, clean=True)
Picture

最佳答案

该库不正式支持 adding/deleting pdf 文档的文本。但是,从记录的问题来看,有一个解决方法。你可以看到答案here来自图书馆作者关于如何使用 Text Modification 解决此问题的文章方法。
我也担心图书馆的文档似乎是 unavailable .不确定这是否是永久性案例,但如果是,您应该考虑使用不同的库。您应该在最佳替代库中看到答案 - Add text to Existing PDF using Python

关于python - 在 Python 中查找、删除文本并将其添加到 pdf 文件中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62793843/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com