gpt4 book ai didi

debugging - 你如何调试PDF文件?

转载 作者:行者123 更新时间:2023-12-03 10:41:09 24 4
gpt4 key购买 nike

很多时候我以编程方式创建 PDF 并且它可能存在问题,例如某些特定的字母可能无法正常显示,或者我可能有编码问题等。

有什么方法可以调试PDF吗?例如。看到它的详细结构了吗?

最佳答案

有许多免费工具可以让您查看未压缩和解密(给定密码)的 PDF 的内部结构。

想到 iText 的 RUPS(但我有偏见)。我不知道是否有 iTextSharp 等价物。它是一个 GUI,带有 PDF 对象的树 View (所有这些应用程序都有)。

有些可以让您在该树中编辑 PDF,但不是很多。我相信 Windjack 的 PDF CanOpener 会(以及您期望从商业 Acrobat 插件中获得的其他几个漂亮的功能)。

在紧要关头,<在此处插入最喜欢的文本编辑器> 可以工作……但不要尝试更改任何内容。 PDF 是一种二进制格式:字节偏移很重要。如果您的文本编辑器将\n 更改为\r\n(或尝试将其解释为 UTF-8、或、或、或),则您的 PDF 将严重损坏。不要那样做。

我最终做了很多搜索给定的对象编号来查找间接引用。查找单个数字引用总是很痛苦,因为“4 obj”出现在每十个对象(14、24、34、1234 等)的末尾。寻找“line-4 obj-end of line”的正则表达式搜索会很棒,但我通常使用记事本,所以就这样了(反正我不是一个正则表达式的人)。

PS : 即使有一个漂亮的 Acrobat 插件(不是开 jar 器,从老家长大),我仍然需要时不时地打开一个文本编辑器。

Acrobat 有时会在加载 PDF 时进行更改(主要是为了修复问题),如果您想知道真正的内容,您需要以其他方式查看该 PDF。当您尝试调试损坏的 PDF 时,Acrobat 的帮助是您最不需要的。

PPS :Acrobat 在其高级-> 预检配置文件中也有一个漂亮的“pdf 语法检查”。它还检查了各种 PDF/* 标准(PDF/X、PDF/A-1 [a 和 b] 等)、可访问性等。当您尝试合规时,它们是无价的。不是你问的调试工具,但非常方便。

PPPS :“区分”两个 PDF 几乎是不可能的,除非编写自定义工具来为您完成。我写了一些东西,以可预测的顺序列出所有页面(带有大小)和字段(带有类型、标志等)并将其转储到一个文本文件中,这样我就可以比较文件……但是直接比较两个 PDF 是没有意义的。 “相同”文件有太多不同的方式(对象顺序、字典键顺序、压缩级别等)。

关于debugging - 你如何调试PDF文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4523283/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com