作者热门文章
- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在尝试使用 jTidy 从(现实世界)HTML 中提取数据。但是 jTidy 不解析自定义标签。
<html>
<body>
<myCustomTag>some text</myCustomTag>
<anotherCustom>more text</anotherCustom>
</body>
</html>
我无法在自定义标签之间获取文本。我必须使用 jTidy,因为我将使用 xpath。
我试过 HTMLCleaner,但它不支持完整的 xpath 函数。
最佳答案
您还可以使用 Java Properties 对象设置属性,例如:
import java.util.Properties;
Properties oProps = new Properties();
oProps.setProperty("new-blocklevel-tags", "header hgroup article footer nav");
Tidy tidy = new Tidy();
tidy.setConfigurationFromProps(oProps);
这应该让您不必创建和加载配置文件。
关于html - 如何向 JTidy 添加新标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8976637/
我是一名优秀的程序员,十分优秀!