gpt4 book ai didi

linux - 给定一个 PDF,如何从命令行提取图像*及其在页面上的位置*?

转载 作者:IT王子 更新时间:2023-10-28 23:52:21 25 4
gpt4 key购买 nike

我有一个包含文本和图像的 PDF。我想使用 linux 命令行从 PDF 中提取图像。我可以使用 pdfimages 来提取图像,但我还想在每个页面上找到该图像所在的位置。 pdfimages 可以告诉我每个图像的页面(来自文件名),但这就是它给我的全部内容。有没有其他 FLOSS 工具可以做到这一点?

最佳答案

嗯,我认为 PDF 必须包含放置它们的信息,所以这应该是可能的。另一方面,解决方案可以是例如:

  1. 使用 pdftoppm 将每个 pdf 页面转换为图像
  2. 使用 pdfimages 从每个页面中提取图像
  3. 使用 cvCvtColor 将图像转换为单个 8 位灰度 channel (以加快分析速度)
  4. 使用 matchTemplate 进行对象检测

第 1 步可能类似于第 2 步:

for i in {0..99} ; do pdfimages -f $((i)) -l $((i+1)) file.pdf page$((i)); done

这里是第 3 步*一个简单的例子

在第 4 步中,您应该不会遇到训练问题,因为图像将完全匹配。 matchTemplate(imageToSearch, pdfPageImg, outputMap, 'CV_TM_SQDIFF')

(* - 链接已删除,因为它现在似乎指向一个勒索软件站点)

关于linux - 给定一个 PDF,如何从命令行提取图像*及其在页面上的位置*?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4581255/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com