gpt4 book ai didi

pdf - 删除 PDF 元数据(删除完整的 PDF 元数据)

转载 作者:行者123 更新时间:2023-12-03 23:08:26 30 4
gpt4 key购买 nike

我想从 PDF 文件中删除元数据。我已经尝试使用“exiftool”、“pdftk”和“qpdf”来删除元数据(建议的方法 - https://gist.github.com/hubgit/6078384)。这些工具声称可以删除元数据,但不幸的是保留了它们。我使用了“grep -a metadata_fieldname file.pdf”选项,我可以检索元数据值。

有没有办法从PDF文件中完全删除元数据信息(删除所有包含元数据信息的对象)。

我正在使用 Ubuntu。当我使用 LaTeX 工具(例如 pdfTeX)或 LibreOffice 创建 PDF 文件时,该工具会自动在 PDF 文件的元数据中写入 Producer、Creator 和有时 Full banner 等信息。所以我希望从 PDF 文件中删除这些信息(基本上是 PDF 创建者工具存储的元数据信息)。

最佳答案

要在您的 ubuntu 终端上使用 pdftk 删除所有 pdf 信息字典,您可以使用以下命令:

pdftk file.pdf  dump_data |sed -e 's/\(InfoValue:\)\s.*/\1\ /g' | pdftk file.pdf update_info - output file_no_meta.pdf
假设 file.pdf 是源文件,您的 pdf 文件输出为 file_no_meta.pdf
接下来,使用以下命令删除 XMP 元数据:
exiftool -all:all= -overwrite_original file_no_meta.pdf
最后,在终端上使用以下命令再次检查文件元数据:
pdfinfo file_no_meta.pdf

关于pdf - 删除 PDF 元数据(删除完整的 PDF 元数据),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60738960/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com