gpt4 book ai didi

ruby - 直接在 Nokogiri 的标签内获取文本

转载 作者:数据小太阳 更新时间:2023-10-29 06:33:12 24 4
gpt4 key购买 nike

我有一些 HTML 看起来像:

<dt>
<a href="#">Hello</a>
(2009)
</dt>

我已经将所有 HTML 加载到名为 record 的变量中。我需要解析年份,即 2009 年(如果存在)。

如何获取 dt 标签内的文本而不是 a 标签内的文本?我使用了 record.search("dt").inner_text,这给了我一切。

这是一个微不足道的问题,但我还没弄明白。

最佳答案

要获取所有带有文本的直接子项,但不包含任何其他子项,您可以像这样使用 XPath:

doc.xpath('//dt/text()')

或者如果您想使用搜索:

doc.search('dt').xpath('text()')

关于ruby - 直接在 Nokogiri 的标签内获取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10799136/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com