gpt4 book ai didi

java - 从多个 PDF 文件中提取特定字段并写入文本文件

转载 作者:行者123 更新时间:2023-12-02 08:14:05 27 4
gpt4 key购买 nike

我有一个充满子目录的目录,所有子目录都包含 PDF 文件和/或子目录充满 PDF 文件。本质上是一组非常无组织的 PDF。我想做的是解析每个文件,提取一个特定字段的内容,然后将输出转储到文本文件。最终结果将是一个大型文本文件,其中包含每个单独 PDF 中的字段内容。这当然是可能的。问题是这是否可以轻松完成,无需太多编程。

最佳答案

在我看来,最好的选择是花一点钱购买提供 API 的第 3 方组件。

http://www.aspose.com/categories/java-components/aspose.pdf-for-java/default.aspx http://www.pdfcomponent.com/java-pdf/

如果不必是Java,我相信PHP有一个开源库。

关于java - 从多个 PDF 文件中提取特定字段并写入文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6770817/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com