gpt4 book ai didi

python - 如何在Python中从文本中提取链接?

转载 作者:行者123 更新时间:2023-12-03 06:28:43 27 4
gpt4 key购买 nike

我正在创建一个程序,该程序告诉YouTube视频在何时链接到何时链接。当我只有一个链接时,我已经可以做我想做的事情,但是我想知道如果给出文本正文该如何获得链接。

例如,如果输入是:

"This is filler to test the program, https://www.youtube.com/watch?feature=player_embedded&v=DkW5CSZ_VII#t=407 that is the link I want to pull out."

我怎样才能简单地得到:
"https://www.youtube.com/watch?feature=player_embedded&v=DkW5CSZ_VII#t=407"

最佳答案

您可以为此使用正则表达式:

import re

s = "This is filler to test the program, https://www.youtube.com/watch?feature=player_embedded&v=DkW5CSZ_VII#t=407 that is the link I want to pull out."

url = re.search("(http.+youtube\.com.+#t=\d+)", s).groups()[0]

但是,一旦使用了 re,就可以直接提取时间(将捕获组移到 \d+的最后,也可以在开始时放弃捕获 http.+的操作):
time = re.search("youtube\.com.+#t=(\d+)", s).groups[0]

请注意,此正则表达式不能与同一文本块中的多个链接一起很好地使用,这可能是一个问题。您可以使用轻松地在线测试正则表达式 regex101

关于python - 如何在Python中从文本中提取链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22980489/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com