gpt4 book ai didi

node.js - 是否可以在不渲染 PDF 的情况下将图像添加到 PDF 中?

转载 作者:太空宇宙 更新时间:2023-11-04 00:46:46 24 4
gpt4 key购买 nike

我正在考虑向 Node.js 中的现有 PDF 添加图像。不过,我发现的 PDF 库似乎都没有能力修改现有的 PDF,因此我计划自己实现它。我试图弄清楚它是否太多工作,因为我总是可以使用 iTextPDF 在服务器端完成它,但我更喜欢在我的应用程序中完成它(使用 Node.js 的 Electron)。

如果我只想修改现有的 PDF 并添加图像,我是否必须编写一个完整的渲染库,或者 PDF 的结构方式使得我可以编写一个非常小的解析器来获取我想要的页面并且使用正确的格式插入图像?

具体来说,我问这个问题是因为我之前曾研究过编写一个文本提取库,为了获取文本的位置,您必须渲染几乎整个 PDF,因为定位的处理方式不同。在这种情况下,绕过服务器端处理的工作量太大。

要明确的是,只是问是否可以这样做,而不是如何去做(不想太宽泛,我确信我能弄清楚那部分)。

最佳答案

要对 PDF 进行少量操作,您需要实现 PDF 数据结构的通用读取、解压缩、加密和遍历。您需要处理的一些事情包括:

  • PDF语法的基本解析
  • 通过交叉引用索引和/或交叉引用索引和对象流进行索引
  • 对象(数字、字节字符串、十六进制字符串、字典、数组、 bool 值...)
  • 过滤器和变体(LZW、Flate、RunLength、预测器)
  • 加密(RC4、AES、自定义安全处理程序)
  • 页面树遍历
  • 页面内容流的基本处理
  • 图像处理
  • 序列化,重写整个 PDF,或对现有 PDF 进行增量更新

一切皆有可能,但实际上,您需要一个 PDF 库或工具包、客户端或服务器端来完成此任务。

关于node.js - 是否可以在不渲染 PDF 的情况下将图像添加到 PDF 中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34384391/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com