gpt4 book ai didi

html - 如何向 JTidy 添加新标签?

转载 作者:搜寻专家 更新时间:2023-10-31 23:11:12 25 4
gpt4 key购买 nike

我正在尝试使用 jTidy 从(现实世界)HTML 中提取数据。但是 jTidy 不解析自定义标签。

<html>
<body>
<myCustomTag>some text</myCustomTag>
<anotherCustom>more text</anotherCustom>
</body>
</html>

我无法在自定义标签之间获取文本。我必须使用 jTidy,因为我将使用 xpath。

我试过 HTMLCleaner,但它不支持完整的 xpath 函数。

最佳答案

您还可以使用 Java Properties 对象设置属性,例如:

import java.util.Properties;
Properties oProps = new Properties();
oProps.setProperty("new-blocklevel-tags", "header hgroup article footer nav");

Tidy tidy = new Tidy();
tidy.setConfigurationFromProps(oProps);

这应该让您不必创建和加载配置文件。

关于html - 如何向 JTidy 添加新标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8976637/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com