gpt4 book ai didi

image - 如何去除 PDF 图像中的抗锯齿?

转载 作者:行者123 更新时间:2023-12-04 04:34:24 26 4
gpt4 key购买 nike

我使用 Abbyy FineReader for ScanSnap 对几个扫描的 PDF 文件进行 OCR。该软件声称它保留了原始 PDF 图像。 OCR 前和 OCR 后的 PDF 文件大小几乎相同,这很好。

软件完成后,所有PDF图像在Acrobat X中都显示抗锯齿。页面导航比以前慢得多,并且当我放大/缩小时,图像首先会快速进入抗锯齿前的版本更改为抗锯齿图像。

Left: Scanned PDF/Right: after OCR with Abbyy
enter image description here

我想获得没有抗锯齿的原始图像。有趣的是,当我在 Photoshop 中从抗锯齿 PDF 打开单个页面时,没有抗锯齿,图像看起来像左边的。

我有限的 PDF 编程经验让我相信 Abbyy 可能会在 OCR 处理期间为每个图像设置某种抗锯齿标志。如何取消设置此标志?

任何指向有用想法的指针将不胜感激。

最佳答案

/Interpolate true OCR 版本的图像字典中的条目,这就是导致“抗锯齿”的原因。这是否(而不是 JPEG2000 而不是 JPEG 压缩)是否是导致速度变慢的原因,请检查足够大的文件。

要取消设置此键,最好在创建文件时将其关闭,如果不可能,则使用合适的语言编写和运行一个小程序。

但是,由于您的文件不包含“压缩对象”,并且违规 key 在文件中清晰可见,因此本着“快速完成工作”的精神,您可以简单地处理您的文件,例如像这样:

perl -M-encoding -0777pe "s!/Interpolate true!' 'x17!ge" <in.pdf >out.pdf

关于image - 如何去除 PDF 图像中的抗锯齿?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20011515/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com