gpt4 book ai didi

python - 使用 Python 在一个大字符串中查找多次出现的不同 URL,其中每个 URL 位于两个特定子字符串之间

转载 作者:太空宇宙 更新时间:2023-11-04 01:20:25 24 4
gpt4 key购买 nike

我有一个文件只包含一个长字符串,其中嵌入了多个 URL。这些 URL 各不相同,但始终包含在两个特定的子字符串之间。如何提取所有 URL?

我的文件内容如下所示:

data-starred-src="www.example.com" data-non-starred-src asdf asdf ghgh data-starred-src="www.someurl.com" data-non-starred-src gjsltg ajshssl ahssfh data-starred-src="www.anotherurl.com" data-non-starred-src

我想提取表单中的URL

www.example.com
www.someurl.com
www.anotherurl.com

最佳答案

在例子中,这个:

print re.findall(r'data-starred-src\s*=\s*"([^"]*)"', line)

给予:

['www.example.com', 'www.someurl.com', 'www.anotherurl.com']

关于python - 使用 Python 在一个大字符串中查找多次出现的不同 URL,其中每个 URL 位于两个特定子字符串之间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21642488/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com