gpt4 book ai didi

java - 如何用 Java 替换 pdf 中的多个 url,最好使用 PdfBox

转载 作者:行者123 更新时间:2023-12-01 11:10:58 26 4
gpt4 key购买 nike

我正在编写一个 Java 应用程序,它将循环遍历 PDF 文件,查找并替换特定的 URL,并将其最后一位(称为 oldreportid)替换为新的(称为 newreportid),两者都作为参数传递。

例如:

这个: http://www.test/test.php?T=MQ==&F= NzQ2

将变成这样: http://www.test/test.php?T=MQ==&F= XXXX

我已经编写了大部分代码,但我卡住了。

下面的代码循环遍历 PDF 文件,查找所有 URL 并将其全部替换为 newreportid。这不是想要的结果,我只想用它替换包含 oldreportid 的 URL:

public class Helper {


public static void getURL(String oldreportid, String newreportid, String oldpdf, String newpdf) {
PDDocument doc = null;

try {
doc = PDDocument.load(oldpdf);
List allPages = doc.getDocumentCatalog().getAllPages();
for (int i = 0; i < allPages.size(); i++) {
PDPage page = (PDPage) allPages.get(i);
List annotations = page.getAnnotations();
for (int j = 0; j < annotations.size(); j++) {
PDAnnotation annot = (PDAnnotation) annotations.get(j);
if (annot instanceof PDAnnotationLink) {
PDAnnotationLink link = (PDAnnotationLink) annot;
PDAction action = link.getAction();
if (action instanceof PDActionURI) {
PDActionURI uri = (PDActionURI) action;
String oldURL = uri.getURI();

String reportID = oldURL.substring(oldURL.lastIndexOf("=") + 1, oldURL.length());
//System.out.println("a " + reportID);
String newURI = "http://www.test.com/test.php?T=MQ==&F=" + newreportid;
//System.out.println("Page " + (i + 1) + ": Replacing " + oldURL + " with " + newURI);
//if (reportID == oldreportid)

uri.setURI(newURI);
}
}
}
}

doc.save(newpdf);

} catch (IOException e) {
e.printStackTrace();
} catch (COSVisitorException e) {
e.printStackTrace();
} finally {
if (doc != null) {
try {
doc.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}
}

所以问题是,如何使其仅更改包含 oldreportid 的 URL?

欢迎任何意见。

谢谢!

最佳答案

您可以使用正则表达式来替换字符串中的参数。

String oldId = "1234Old";
String newId = "4321New";

String newString = oldURL.replaceAll("(&F=)" + Pattern.quote(oldId) + "(&|$)", "$1" + newId + "$2");

上面的正则表达式将匹配&F=oldId的参数

Pattern.quote() 会转义 oldId,以防它包含正则表达式控制字符。

(&|$) 模式确保参数在 oldId 之后停止 - 它必须是 & 符号(表示下一个参数的开始)或 URI 字符串的结尾。

关于java - 如何用 Java 替换 pdf 中的多个 url,最好使用 PdfBox,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32379372/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com