gpt4 book ai didi

html - 解析没有 HTML 标签的数据

转载 作者:太空宇宙 更新时间:2023-11-03 16:59:33 29 4
gpt4 key购买 nike

我需要从下面列出的 html 中提取实际的电话号码,但我不确定如何使用 Nokogiri CSS 来完成它,因为它周围没有 html 标签。当 at_css(.phonetitle) 时,它只解析电话而不解析号码。

<div class="detail">
<span class="address">Corner of Toorak Road and Chapel Street, South Yarra</span><br>
<span class="phonetitle">Phone</span> 95435 34341
<br><br>
</div>

最佳答案

没有一点 XPath 无法处理的:

#!/usr/bin/env ruby
require 'nokogiri'

doc = Nokogiri::HTML(<<-HERE)
<div class="detail">
<span class="address">
Corner of Toorak Road and Chapel Street, South Yarra
</span><br>
<span class="phonetitle">Phone</span> 95435 34341
<br><br>
</div>
HERE

puts doc.search('*[@class="detail"]/text()').text.strip
# => 95435 34341

关于html - 解析没有 HTML 标签的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2482325/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com