gpt4 book ai didi

Ruby + 如何将 pdf 拆分为单独的页面?

转载 作者:太空宇宙 更新时间:2023-11-03 16:53:18 25 4
gpt4 key购买 nike

我正在使用 Docsplitpdf 拆分为使用

的页面
Docsplit.extract_pages("my.pdf").

但是我想把页数限制在4个,我试过了

Docsplit.extract_pages("my.pdf", :pages => 1..4) 

这是行不通的..

谁能告诉我该怎么做

最佳答案

  1. 安装pdftk在您的机器中(如果尚未完成)并相应地设置您的路径
  2. 像这样从 lib/docscript/page_extractor.rb:18 文件中删除 ESCAPE:

    pdftk #{ESCAPE[pdf]} 连发输出#{ESCAPE[page_path]} 2>&1"

更改为:

pdftk #{pdf} burst output #{page_path} 2>&1"
  1. 默认情况下,gem 会忽略您提供的页面范围,它会为每一页创建一个 pdf 文件。如果您对此感到满意,那么输出页面将创建在与您的输入文件相同的文件夹中。

但是,恕我直言,最简单的解决方案是直接使用 pdftk 二进制文件,这非常简单:要提取第 1-4 页,您可以使用以下代码片段:

in_file = 'IN.pdf'
range = 1..4
range_s = range.to_s.gsub('..', '-')
cmd = "pdftk.exe #{in_file} cat #{range_s} output pages#{range_s}.pdf"
res = `cmd`.chomp

只要 pdftk 可执行文件在您的 PATH 中,这就可以工作

关于Ruby + 如何将 pdf 拆分为单独的页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16234051/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com