gpt4 book ai didi

java - 如何从 Java 验证 HTML?

转载 作者:技术小花猫 更新时间:2023-10-29 12:40:50 26 4
gpt4 key购买 nike

从 Java 验证 HTML 的快速简单方法是什么?我正在寻找一个描述 100 多个 HTML 标记的各种属性的开源/PD 类(或一组类),例如:

  1. 标签是可选的吗?空的?省略其结束标记是否合法?
  2. 此标签可以包含哪些其他标签(如果有)?
  3. 哪些属性对于这个标签是合法的,它们的类型是什么? (不是必需的,但很高兴拥有)

谢谢!

编辑

我希望对 HTML 文档进行逐个标记的分析,因此我对整个文档是否有效不太感兴趣,而是对每种类型的标记的具体要求是什么.我可以根据 W3C 规范对规则进行编码,但想先看看有哪些现成的解决方案可用。

最佳答案

如果你想验证某些标签是否符合某些规范,基于 Java 的 HTML 解析器似乎没有尽头:

Open Source HTML Parsers in Java

换句话说,您可以解析 HTML,然后检查生成的文档中是否有您要查找的标签,并确定它们是否符合您要求的规范。如果他们不这样做,您就可以抛出一个错误。

我认为您不会找到完全按照您的要求编写的 HTML 分析工具,主要是因为这些要求尚未明确表达,而且可能有点模糊。

如果解析器不能开箱即用,至少这个列表是开源的,所以只要您发布更改,您就可以破解解析器。

关于java - 如何从 Java 验证 HTML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4392505/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com