gpt4 book ai didi

pdf - 有没有办法以编程方式从 PDF 文件中删除所有空白页?

转载 作者:行者123 更新时间:2023-12-04 09:33:54 25 4
gpt4 key购买 nike

如今,购买电子书比死树版本更实用。但是 PDF 经常包含打印版使用的空白页。我通常会看到每本电子书 10-30 个空白页(或带有文本“此页故意留空。”的页面)。是否可以以编程方式删除这些空白页?目前我手动识别空白页,然后通过这个运行它:

pdftops orig.pdf - | psselect "$range_of_non_blank_pages" | ps2pdf - new.pdf

所以困难的部分是识别空白页。 pdftotext 在大多数情况下都可以使用,除非页面只有图像而没有文本。

此外,即使删除了许多页面并看到生成的文件大小更小,在缩小原始文件和新版本后(使用互联网上的各种方法),原始文件通常会小几百 KB 或更多。因此,我用来删除空白页的方法似乎无法创建最佳 pdf。我还尝试了各种 gui 程序,并在这方面看到了相同的结果。

最佳答案

部分答案:您不需要通过后记(这可能是您获得更大文件的原因)。一种可能性是

pdftk orig.pdf cat "$range_of_non_blank_pages"输出 new.pdf

要识别空白页面,您需要使用一种工具,该工具不仅可以选择和重新组合页面。尝试使用脚本语言库,例如 Perl 中的 CAM::PDF 或 PDF::API2。

关于pdf - 有没有办法以编程方式从 PDF 文件中删除所有空白页?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3242265/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com