gpt4 book ai didi

html - Nokogiri 可以使用 SAX 解析器来解析 HTML 片段吗?

转载 作者:数据小太阳 更新时间:2023-10-29 08:06:26 25 4
gpt4 key购买 nike

我有这个代码。

class MyParser < Nokogiri::XML::SAX::Document
def characters(string)
LOG.debug("characters #{string}")
end

def start_element(name, attrs = [])
LOG.debug("start_element #{name}")
end

def end_element(name)
LOG.debug("end_element #{name}")
end
end

parser = Nokogiri::HTML::SAX::Parser.new(MyParser.new)
parser.parse(File.new($*[0], 'rb'))

在这样的 HTML 片段上运行,

<h1>Hello</h1> 
<p>Hi.</p>

输出显示只处理了第一个元素:

start_element h1
characters Hello
end_element h1

如果我将片段包裹在 htmlbody 标签中,整个输入都会被解析。

有没有办法在 HTML 片段上使用 SAX 样式的解析器?

最佳答案

您需要将片段包装在根元素中:

<div>
<h1>Hello</h1>
<p>Hi.</p>
</div>

应该可以解决您的问题。

关于html - Nokogiri 可以使用 SAX 解析器来解析 HTML 片段吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2452271/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com