gpt4 book ai didi

pdf - 如何将不可见文本插入 PDF?

转载 作者:行者123 更新时间:2023-12-01 11:57:53 25 4
gpt4 key购买 nike

更新:请参阅 https://softwarerecs.stackexchange.com/questions/71464/java-library-to-insert-invisible-text-into-a-pdf相反。

我想在现有的 PDF 文件中插入不可见的文本,以使其可搜索。

我应该使用什么库
我希望能链接到特定的 API 方法以供使用。

免费,最好是开源。
非常感谢!

(出于好奇:我想在 Alfresco 存储库中自动对传入的扫描文件进行 OCR,并使其可搜索)

最佳答案

3 个选项。我的答案是特定于 itext 的,但您应该能够将底层方法转换为任何足够先进的 PDF 库。

  1. 文本呈现模式 3:“无描边,无填充”。使用 iText:myPdfContentByte.setTextRenderMode(PdfContentByte.TEXT_RENDER_MODE_INVISIBLE);
  2. 在某物后面画出文字。您可能正在使用扫描的页面图像。 iText myPdfStamper.getUnderContent(pageNum) 使这很容易,并且可以让您在扫描下绘制文本。允许您访问页面内容的其他库可能会要求您在现有内容流的开头添加“原始”文本。您需要查看“PDF 规范”(谷歌,您会没事的)以了解详细信息。第 9 章是关于文本渲染的。
  3. 在页面的媒体或裁剪框外绘制文本。如果您只是想让一些随机的精通 PDF 的搜索引擎打开您的页面,这会起作用,但如果您想让查看 PDF 的人看到适当的文本选择框……就没那么多了。

关于pdf - 如何将不可见文本插入 PDF?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5138286/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com