gpt4 book ai didi

java - 向 pdf 添加文本?

转载 作者:行者123 更新时间:2023-12-01 18:26:49 29 4
gpt4 key购买 nike

所以我有一个议程的 pdf 模板,我想知道的是如何检测日期应该在哪里。

假设模板中有单词“DATE:”。

之后,我想在该空间旁边添加相应的日期/文本,以便检测“日期:”,写入后它看起来像“日期:13/02/2020”并将其另存为新的 pdf

最佳答案

您已将您的问题标记为 。这使得它非常广泛。因此,我的回答也是笼统的,而不是具体的。一般来说,您应该决定您需要哪种语言。

对于您的任务,您需要做两件事,

  • 首先将带有坐标的文本提取应用到您的 pdf 中,在文本中搜索该日期标记,并确定该文本片段之后的坐标;有些库允许快捷方式,并且具有仅提取与正则表达式及其坐标匹配的文本的例程;

  • 然后在这些坐标处将文本添加到内容中。

java 和 python 的核心都没有明确的 pdf 支持。因此,对于您的任务,您必须为这些任务选择一个 pdf 库。 (理论上您可以尝试实现自己的 pdf 处理例程,但 pdf 格式相当复杂,因此通常需要很长时间。)

因此,您首先应该检查您所选语言的通用 pdf 库最适合这些任务和您的其他要求(例如许可)。 Stack Overflow 上有很多关于文本提取的问题和答案,可以帮助您进行选择。

<小时/>

不过,请注意,并非所有 pdf 都允许正确提取文本。有些 pdf 生成器不会将文本提取所需的信息添加到 pdf 中;有些甚至添加了误导性信息。因此,您可能必须拒绝某些模板。或者,如果模板是固定的,只需通过在 pdf 查看器中测量或通过反复试验来确定文本插入的正确坐标。

如果您仍然对需求有影响,建议使用带有 pdf AcroForm 表单字段的模板。表单字段填写允许模板设计者对填写内容的定位和样式进行更多控制,并且填写比上述过程更容易。如果您不希望结果 pdf 中出现表单字段,只需在填写后压平表单即可。

关于java - 向 pdf 添加文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60217362/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com