gpt4 book ai didi

watermark - 更新 PDF 以包含加密的、隐藏的、唯一的标识符?

转载 作者:行者123 更新时间:2023-12-01 19:13:53 25 4
gpt4 key购买 nike

背景

想法是这样的:

  • 此人提供在线图书购买的联系信息
  • PDF 格式的图书标有唯一的哈希值
  • 有人下载书籍
  • PDF 密码很容易被规避或共享

理想的过程是这样的:

  1. 根据联系信息生成哈希
  2. 将联系信息和哈希值存储在数据库中
  3. 获取书锁
  4. 使用哈希文本更新“包含”文件
  5. 将书籍生成为 PDF(使用 pdflatex)
  6. 将哈希应用于图书
  7. 解除书本锁
  8. 发送包含图书下载链接的电子邮件

技术

可以使用以下技术(也可以使用其他编程语言,但库可能仅限于主机提供的库):

  • C、Java、PHP
  • LaTeX 文件
  • PDF 文件
  • Linux

问题

我应该研究哪些编程技术(或开源软件):

  • 在 PDF 中嵌入唯一的哈希值(或其他标记)
  • 创建防共谋攻击标记
  • 开发一个非脆弱(例如,PDF -> EPS -> PDF 仍包含该标记)的解决方案

研究

我研究了以下可能性:

  • 隐写术
  • 自然语言处理 (NLP)
  • 将 PDF 中的空白页转换为图像;标记这些图像;重新组合 PDF
  • LaTeX水印包
  • ImageMagick

问题

我研究过的可能解决方案存在以下问题:

  • 隐写术。 (a) 需要图像的主副本,并将其转换为 EPS,这会占用 CPU 资源且耗时; (b) 水印能否在 PDF -> EPS -> PDF 或其他类型的转换中保留下来? (c) 大多数图像是绘图或屏幕截图,而不是 PNG 格式的照片。
  • LaTeX。创建图像缓存;任何隐写解决方案都必须以某种方式拦截该过程。
  • NLP。引入语法错误;可能会改变技术词汇的含义。
  • 空白页。立即怀疑;替换可疑的空白页很容易。
  • 水印包。绘制可见标记。
  • ImageMagick。绘制可见标记。

还有哪些其他可能的解决方案?

相关链接

谢谢!

最佳答案

我已经为另一个项目完成了此操作 PDFlib 。我们需要对生成的 PDF 进行追踪,以防文件泄露。基本上:

  1. 创建了包含适当内容的源模板 PDF,使用所需选项(禁止编辑、禁止打印、禁止屏幕阅读器等)设置文档主密码
  2. 在运行时,我们应用了一些水印(强加的页脚显示“此文档已由用户 #12345 checkout ”,设置了一些包含用户 ID、下载 IP、下载日期/时间的元数据字段,添加了“此文档版权归...”封面页等...)
  3. 可以选择附加用户密码,以在打开文档时强制显示密码提示。

由于最新的 PDF 版本使用 AES-128 进行加密,我们只需设置一个合适的随机生成的 128 个字符的高熵密码 - 没有人会手动输入它,因此难以输入与我们无关,并且实际上更可取。主密码阻止最终用户对文档进行任何更改。各种无打印/无屏幕阅读选项实际上是由 PDF 阅读器强制执行的,因此可以绕过,但无论如何设置它们也没有什么坏处。

这样做的缺点是 PDFlib 的许可相当严格。我不知道是否有任何免费的 php PDF 库支持最新的 PDF 加密方案,尤其是主密码,但如果您的预算可以支持,那么 PDFlib 就是安全文档制作的最佳选择。

关于watermark - 更新 PDF 以包含加密的、隐藏的、唯一的标识符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4536334/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com