作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我使用 Abbyy FineReader for ScanSnap 对几个扫描的 PDF 文件进行 OCR。该软件声称它保留了原始 PDF 图像。 OCR 前和 OCR 后的 PDF 文件大小几乎相同,这很好。
软件完成后,所有PDF图像在Acrobat X中都显示抗锯齿。页面导航比以前慢得多,并且当我放大/缩小时,图像首先会快速进入抗锯齿前的版本更改为抗锯齿图像。
Left: Scanned PDF/Right: after OCR with Abbyy
我想获得没有抗锯齿的原始图像。有趣的是,当我在 Photoshop 中从抗锯齿 PDF 打开单个页面时,没有抗锯齿,图像看起来像左边的。
我有限的 PDF 编程经验让我相信 Abbyy 可能会在 OCR 处理期间为每个图像设置某种抗锯齿标志。如何取消设置此标志?
任何指向有用想法的指针将不胜感激。
最佳答案
有/Interpolate true
OCR 版本的图像字典中的条目,这就是导致“抗锯齿”的原因。这是否(而不是 JPEG2000 而不是 JPEG 压缩)是否是导致速度变慢的原因,请检查足够大的文件。
要取消设置此键,最好在创建文件时将其关闭,如果不可能,则使用合适的语言编写和运行一个小程序。
但是,由于您的文件不包含“压缩对象”,并且违规 key 在文件中清晰可见,因此本着“快速完成工作”的精神,您可以简单地处理您的文件,例如像这样:
perl -M-encoding -0777pe "s!/Interpolate true!' 'x17!ge" <in.pdf >out.pdf
关于image - 如何去除 PDF 图像中的抗锯齿?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20011515/
我是一名优秀的程序员,十分优秀!