gpt4 book ai didi

file - 将 PDF 转换为具有相同分辨率的 PNG - Imagemagick

转载 作者:行者123 更新时间:2023-12-05 07:48:54 25 4
gpt4 key购买 nike

我有 1000 个多页 PDF,每个 PDF 都有不同的分辨率(基于用于扫描它们的扫描仪)。我想将每一页 PDF 转换为 PNG,以将其传递给 Tesseract 进行 OCR。我使用 Imagemagick 转换为 PNG,但必须为所有图像传递固定的 DPI 以获得良好的可读输出。有没有一种方法可以通过保留该 PDF 的分辨率来转换每个 PDF?

例如,如果 1.PDF 的分辨率为 622‖×‖788,而 2.pdf 的分辨率为 792‖×‖612,我想要具有相同分辨率的精确转换,只是格式不同 (PNG)。

我现在使用的命令是:

convert -monochrome -density 1200 input.pdf -resize 25% -monochrome -white-threshold 50% -black-threshold -50% output.png

谢谢,帕夏

最佳答案

也许读取第一页的几何形状,然后调整所有页面的大小以匹配?

SIZE=$(identify -format '%g' input.pdf)
convert -monochrome \
-density 1200 \
-resize $SIZE \
-white-threshold 50% \
-black-threshold -50% \
-append \
output.png

关于file - 将 PDF 转换为具有相同分辨率的 PNG - Imagemagick,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38019769/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com