gpt4 book ai didi

java - 解析格式错误的 XML 文档(如 HTML 文件)

转载 作者:行者123 更新时间:2023-11-27 22:50:12 25 4
gpt4 key购买 nike

解析后,我想删除危险代码并以正确格式重新写出。

目的是防止脚本通过电子邮件进入,但仍然允许大量不良 HTML 工作(至少不会完全失败)。

有图书馆吗?有没有更好的方法让脚本远离浏览器?

重要的是程序不会抛出解析异常。该程序可能会做出最佳猜测,即使它是错误的也是可以接受的。

编辑:如果您对你们认为哪个解析器更好以及为什么提出意见,我将不胜感激。

最佳答案

对于灵活的解析,您可能需要查看 JSoup .但是白名单是去这里的方法。如果您只是禁止一堆“危险”元素,那么有人可能会找到一种方法来通过您的解析器偷偷摸摸。相反,您应该只允许一小部分安全元素。

关于java - 解析格式错误的 XML 文档(如 HTML 文件),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4401558/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com