gpt4 book ai didi

c++ - libxml 解析 html - 未配对的标签损坏

转载 作者:行者123 更新时间:2023-11-28 08:25:56 25 4
gpt4 key购买 nike

我需要使用 libxml 在 C++ 中解析 html 页面。我在使用某些函数时遇到问题 doc = htmlParseDoc( (xmlChar*)ptr, NULL );控制台注意到一个问题似乎解析器中断了li>Now li - 未配对的标签。解析器说数字打开标签 li 不匹配关闭标签/li。也许有些帮助如何处理这个?我肯定会得到任何帮助,很抱歉英语不是我的母语。我尝试了 tidy 但 tidy trankate 这部分带有消息的 html。我试图用 xpath 接口(interface)进行解析,但这没有用。

最佳答案

如果您愿意在 Windows 上使用托管代码 (C#),您可以使用 HTML Agility pack处理这个错误的 HTML 输入。

否则,类似于 Tidy可能对你有用。

关于c++ - libxml 解析 html - 未配对的标签损坏,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4092879/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com