gpt4 book ai didi

java - 解析格式错误的 HTML 文档

转载 作者:太空宇宙 更新时间:2023-11-04 02:04:50 24 4
gpt4 key购买 nike

<分区>

HTML 内容:

<div id=xyz style="test" class=tt>
<p>Some data</p><br/>Blah blah blah
<input>
</div>

这将呈现为:

Some data

Blah blah blah

这里的 html 代码格式不正确,我正在尝试将文本数据作为像这样的简单字符串获取

string s="Some data\n\nblah blah blah";

DOM 和 SAX 都无济于事。

问题:

是否有任何 (C/C++/Java) 库可用于解析格式不正确的 HTML 文件?

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com