gpt4 book ai didi

python - 向 pdf 添加信息,PyPDF2 合并速度太慢

转载 作者:太空宇宙 更新时间:2023-11-03 12:08:28 24 4
gpt4 key购买 nike

我想要 pdf 的每一页上的文本。此文本是一个 html 代码,看起来像 <p style="color: #ff0000">blabla</p>为了在最终文档中显示为红色,我将其转换为 pdf(html2pdf lib),然后将其合并(PyPDF2 lib)到我的 pdf 的每一页。 ...但是合并速度很慢!

我的问题是:有没有比 PyPDF2 的 page.mergePage 方法更快的合并 pdf 的方法?(或者是否有更快的方法将我的文本添加到此 pdf 中?)

谢谢!(在 Windows 8 上使用 python 2.7.5)

最佳答案

由于您所做的只是向页面添加一些文本,因此您可以通过直接编辑页面的内容流来加快该过程。合并必须处理显着减慢进程的字体、其他资源、裁剪框等。如果你真的需要修改其中的一些东西,解决方案就会变得更加复杂。一些示例代码:

TEXT_STREAM = []  # The PS operations describing the creation of your text
def add_text(page):
"Add the required text to the page."
contents = page.getContents()
if contents is None:
stream = ContentStream(TEXT_STREAM, page.pdf)
else:
contents.operations.extend(TEXT_STREAM)

关于python - 向 pdf 添加信息,PyPDF2 合并速度太慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18105751/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com