gpt4 book ai didi

java - 如何在 Java 中使用 Jericho 查找自定义开始标记?

转载 作者:塔克拉玛干 更新时间:2023-11-02 20:18:37 24 4
gpt4 key购买 nike

正如标题所说,我正在尝试匹配 <foo:bar ...> 形式的非标准 StartTagType

我该如何处理 Jericho?

编辑:

我创建了以下自定义 StartTagType:

PrimoResultStartTagType primoSTT = new PrimoResultStartTagType("search", "<sear:DOC", ">", EndTagType.NORMAL, false, true, true);

...和:

class PrimoResultStartTagType extends StartTagType {

protected PrimoResultStartTagType(String arg0, String arg1, String arg2, EndTagType arg3, boolean arg4, boolean arg5, boolean arg6) {
super(arg0, arg1, arg2, arg3, arg4, arg5, arg6);
}

@Override
protected Tag constructTagAt(Source arg0, int arg1) {
return null;
}

}

但是,当我执行 source.getAllElements(...) , 我没有匹配到。

最佳答案

也许它会有所帮助:

示例 html:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">
<title>StartTagType (Jericho HTML Parser 3.1)</title>
</head>

<body>

<span>simple tag</span>

<test:name>custom tag</test:name>

</body>

</html>

和示例代码:

public class Main {

public static void main(String[] args)
throws IOException {

URL url = Main.class.getClassLoader().getResource("test.html");
Source source = new Source(url);
List<Element> elementList = source.getAllElements("test:name");
for (Element element : elementList) {
System.out.println("Custom tag content: " + element.getContent().toString());
}
}

输出:

Custom tag content: custom tag

关于java - 如何在 Java 中使用 Jericho 查找自定义开始标记?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3537355/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com