gpt4 book ai didi

ruby - RegEx删除换行符并替换为逗号

转载 作者:数据小太阳 更新时间:2023-10-29 08:04:26 26 4
gpt4 key购买 nike

我使用 Nokogiri 抓取了一个网站,在使用 xpath 之后,我得到了以下字符串(将几个 td 插入一个字符串)。

"Total First Downs\n\t\t\t\t\t\t\t\t359\n\t\t\t\t\t\t\t\t274\n\t\t\t\t\t\t\t"

我的目标是将它变成一个如下所示的数组(它将是一个嵌套数组):

["Total First Downs", "359", "274"]

问题是创建一个删除转义字符的正则表达式方程式,在最后一组整数之后替换为一个“,”但不替换为“,”。如果最后一组整数后的逗号是必需的,我可以使用#compact 来摆脱数组中出现的 nil。如果您需要有关我如何在此处抓取网站的代码:(请注意,我保存了该网页以进行测试,以免我的 IP 地址在试用阶段被烧毁)

f = File.open('page')
doc = Nokogiri::HTML:(f)
f.close

number = doc.xpath('//tr[@class="tbdy1"]').count

stats = Array.new(number) {Array.new}
i = 0

doc.xpath('//tr[@class="tbdy1"]').each do |tr|
stats[i] << tr.text
i += 1
end

谢谢你的帮助

最佳答案

我不完全理解你的问题,但是这样可以很容易地实现结果:

"Total First Downs\n\t\t\t\t\t\t\t\t359\n\t\t\t\t\t\t\t\t274\n\t\t\t\t\t\t\t"
.split(/[\n\t]+/)
# => ["Total First Downs", "359", "274"]

关于ruby - RegEx删除换行符并替换为逗号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21025762/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com