gpt4 book ai didi

java - itext如何检查pdf页面上是否存在巨型字符串

转载 作者:行者123 更新时间:2023-12-01 11:09:37 35 4
gpt4 key购买 nike

-我正在使用 IText 插件在我的 java 项目上创建/读取 pdf。-我正在从任何扩展名(pdf、doc、word等)读取多个文本文件并将其内容写入新的pdf(所有文件的所有内容结合在一起)-为了分隔巨大的pdf上每个文件的每个内容,我总是开始一个新页面,在新页面的开头用红色写下文件的确切路径,然后写下文件的内容

问题:

  • 我想写下此 pdf 文件有多少页
  • 如何检查 pdf 页面上是否存在字符串?我有所有文件路径,所以我想检查页面上是否写有任何路径
  • 我按照本教程提取了我的任何页面的字符串:http://www.quicklyjava.com/read-pdf-file-in-java-using-itext/
  • 但是当我提取所有页面并检查页面上是否存在我的文件路径时(执行 string.contains(...)),系统在页面上找不到我的文件路径pdf页面!我检查了为什么会发生这种情况,当我输出一页的字符串时,它是这样的:

    1.软件注册的 PdfGenerator/软件注册的 PdfGenerator/src/br/ufrn/pairg/pdfgenerator/LeitorArquivoTexto.java包 br.ufrn.pairg.pdfgenerator;

    导入java.io.BufferedReader;导入java.io.File;导入 java.io.FileReader;导入java.io.IOException;导入java.util.Scanner;

    公共(public)...

当我检查文件路径是否为“PdfGeneratorForSoftwareRegistration/PdfGeneratorForSoftwareRegistration/src/br/ufrn/pairg/pdfgenerator/LeitorArquivoTexto.java”出现在这个巨大的字符串中,系统没有找到它。你能看到问题吗?我的路径太大了,占据了2行!这就是问题!

所以,我的问题是:有没有办法使用 itext 插件检查 pdf 文本中是否存在巨大字符串?

最佳答案

这不是最好的解决方案,但我通过在我的第一个 pdf 上的每个路径名之上编写一个神奇的 id(如“#%&#id_0#%&#”)来解决它。然后,我再次阅读pdf并检查是否有id。如果有,我会将其与我的文件路径相关联。

问题已解决:我使用 http://www.quicklyjava.com/read-pdf-file-in-java-using-itext/ 的解决方案获取页码

问题:如果项目中有任何文件上面写有#%&#id_0#%&#,#%&#id_1#%&#...,我的程序将无法运行。

关于java - itext如何检查pdf页面上是否存在巨型字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32527211/

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com