gpt4 book ai didi

ruby - 使用 RegExp (Ruby) 从 HTML 标签中提取字符串

转载 作者:太空宇宙 更新时间:2023-11-03 17:16:38 25 4
gpt4 key购买 nike

我想从字符串中提取“toast” <h1>test</h1><div>toast</div> .什么正则表达式可以隔离这样的字符串?

编辑:感谢更正格式的用户。

更多信息:永远只有一个 div 标签的实例,里面的信息可能会改变,但在同一个字符串中永远不会有另一个 div 标签(字符串比给定的样本大)

谢谢!

最佳答案

您可以使用 Nokogiri .

require 'nokogiri'

doc = Nokogiri::HTML::Document.parse("<div> test </div> <div> toast </div>")
doc.css('div').map(&:text)
# => [" test ", " toast "]

require 'nokogiri'

doc = Nokogiri::HTML::Document.parse("<h1>test</h1><div>toast</div>")
doc.at_css('div').text
# => "toast"

关于ruby - 使用 RegExp (Ruby) 从 HTML 标签中提取字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18110183/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com