gpt4 book ai didi

java sax 解析格式不正确的 xml

转载 作者:行者123 更新时间:2023-12-01 15:29:45 24 4
gpt4 key购买 nike

我正在使用 Java 和 SAX 从搜索引擎实现 RSS 搜索功能。但是,某些搜索结果的格式不正确,即 <title> 的正文某些条目的标签包含 &字符而不是 &amp;等等(例如,像 Starsky & Hutch )。

解析 RSS 时,我得到 org.apache.harmony.xml.ExpatParser&ParseException ,导致整个搜索中断并且没有返回任何内容。

我希望我的解析器能够解决这些错误,就像 Firefox 的 RSS 阅读器那样。解决此问题并解析 RSS 提要的可能性有哪些?

最佳答案

SAX 实现通常设计用于检测错误并引发异常,并且没有标准方法可以解决此问题。我能想到的最合理的做法是在流式传输到 SAX 之前尝试修补错误,例如杂散和字符。

关于java sax 解析格式不正确的 xml,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9688912/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com