(.*)\\/.match(self.agent.page.content) self.a-6ren">
gpt4 book ai didi

ruby-on-rails - ruby regex 使用最后一个匹配来分隔字符串,但应该首先使用

转载 作者:行者123 更新时间:2023-12-04 16:19:43 24 4
gpt4 key购买 nike

我正在解析一个网站的来源,我正在使用这个正则表达式:

/page\.php\?id\=([0-9]*)\"\>(.*)\<\/a\>\<\/span\>/.match(self.agent.page.content)
self.agent.page.content包含由 Mechanize 获取的页面的来源。正则表达式基本上可以工作,但在第二个匹配中它确实获取了比它应该更多的东西,因为有不止一个 <\/a\>\<\/span\>在源代码中,正则表达式使用最后一个,所以我得到了一堆 html 废话。如何告诉正则表达式将第一个匹配项用作“结束标记”?

最佳答案

.* 是贪婪的,而 .*?是非贪婪的。尝试:

/page\.php\?id\=([0-9]*)\"\>(.*?)\<\/a\>\<\/span\>/.match(self.agent.page.content)

关于ruby-on-rails - ruby regex 使用最后一个匹配来分隔字符串,但应该首先使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10033414/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com