gpt4 book ai didi

ruby - 如何从注释的 HTML 标签中提取文本

转载 作者:太空宇宙 更新时间:2023-11-03 17:45:08 24 4
gpt4 key购买 nike

我有一个用 Nokogiri 解析过的页面,但我需要从注释标签中获取文本。 HTML 如下:

<div class="parent">
<div class="child">
<span class="visible"> hello </span>
<!-- <span class="commented"> hi </span> -->
</div>
</div>

假设我将页面作为 Nokogiri page 对象,这是我尝试过的,但它给了我 0:

page.xpath("//div[@class='parent']/div[@class='child']/comment()").each {|comment| comment.text }

仅运行:

page.xpath("//div[@class='parent']/div[@class='child']/comment()")

给出:

[#<Nokogiri::XML::Comment:0x3fe466d8d634 " <span class=\"commented\">hi  </span> ">]

我不知道如何获取 hi 文本。

最佳答案

我不是 Nokogiri 专家,但这样的方法似乎有效

comment_node = Nokogiri::HTML(page.at("//div[@class='parent']/div[@class='child']/comment()").text)
comment_node.text.strip
=> "hi"

关于ruby - 如何从注释的 HTML 标签中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40217194/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com