gpt4 book ai didi

java - 在格式错误的 HTML 中按类型获取元素

转载 作者:行者123 更新时间:2023-12-02 00:54:03 25 4
gpt4 key购买 nike

在 Java 中检索格式错误的 HTML 页面中具有某种类型的所有元素的最简单方法是什么?所以我想做这样的事情:

public static void main(String[] args) {
// Read in an HTML file from disk
// Retrieve all INPUT elements regardless of whether the HTML is well-formed
// Loop through all elements and retrieve their ids if they exist for the element
}

最佳答案

HtmlCleaner在处理(有些)格式错误的 HTML 方面,可以说是最好的 HTML 解析器之一。

文档是 here一些代码示例;您基本上是在寻找 getElementsByName() 方法。

看看Comparison of Java HTML parsers如果您正在考虑其他库。

关于java - 在格式错误的 HTML 中按类型获取元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1712464/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com