gpt4 book ai didi

pdf - 有没有办法修复 PDF 文件中的截断文本?

转载 作者:行者123 更新时间:2023-12-04 14:56:28 24 4
gpt4 key购买 nike

我有一个库手册,创建者更改了一些 LaTeX 代码并更改了页面位置和大小,但在编译、提取和发送之前没有检查它。他目前不可用,所以如果我想打印它,我必须自己修复它。

我能够使用一些 ghostscript 命令将整个文本向下推送到接近页面中心的内容,命令如下所示:

/usr/bin/gs -sDEVICE=pdfwrite -o /home/user/shiftdown.pdf -dPDFSETTINGS=/prepress -c "<</PageOffset [0 -35]>> setpagedevice" -f /home/user/brokendoc.pdf

问题是,虽然页面现在可以在不影响硬件边距的情况下打印,但章节标题仍然在顶部被截断了一半。如果我在 Acrobat 或 Reader 中打开 PDF,我可以选择章节标题并复制它,然后将全文粘贴到我选择的程序中。当我尝试在带有部分不兼容驱动程序的 Xerox MFP 上打印它时,它打印了标题,但它不会双面打印,而且我不想打印 700 多页,然后使用复印到 1 -> 2 功能。

有谁知道修复这些截断的标题的方法,以便它们在 PDF 文件中正确显示或至少可靠地正确打印?我有很容易获得的 ghostscript,相对容易获得的 TeX 和 Acrobat X 的标准版本。

[更新:]

下载 Acrobat Pro XI 的演示后,我可以转到“打印制作”选项卡并单击“编辑对象”。当我点击截断的章节标题时,它向我展示了两个覆盖整个页面的边界框,其中一个比另一个高一点。当我右键单击它时,我可以选择添加剪辑和删除剪辑。当我单击删除剪辑时,它会显示整个章节标题。如果我单击“添加剪辑”,它会显示“一个或多个选定区域已经有一个剪辑区域。继续为选定对象设置剪辑区域?[否] [是]”

有了这些附加信息,我知道必须有一种方法可以在批处理模式下解决问题,有人知道什么命令会转换成这个吗?

最佳答案

没有看到'brokendoc.pdf'就很难知道。如果我看到该文件,我可以告诉您发生了什么,以及(可能)如何修复它或解决它。

我不需要整个文件,所以只需要一个只有几页显示问题的缩短版本就足够了。您可以使用以下方法从完整的 Brokendoc.pdf 中获取此信息:
gs -sDEVICE=pdfwrite -o part.pdf -dLastPage=10brokendoc.pdf

此外,您可能想尝试:
gs -sDEVICE=pdfwrite -o fited.pdf -dPDFFitPage -sPAPERSIZE=letter -dFIXEDMEDIA Brokendoc.pdf

以上将缩放(和居中)页面到指定的页面大小。您可以指定 'letter' 或 'a4' 或使用 -dMEDIAWIDTHPOINTS= _ -dMEDIAHEIGHTPOINTS=_ 以获得特定的输出页面大小。 -dFIXEDMEDIA 选项会导致 gs 忽略文件中的 MediaBox。

关于pdf - 有没有办法修复 PDF 文件中的截断文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14594571/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com