gpt4 book ai didi

python - 绝对 url 的正则表达式

转载 作者:太空宇宙 更新时间:2023-11-04 10:19:40 25 4
gpt4 key购买 nike

我一直在寻找与 Python 的 re 模块兼容的正则表达式,用于查找 HTML 文档中的所有 URL,但我找不到它,除了一个只能检查 url 是否有效的或无效(使用 match 方法)。我想做简单的

import requests
html_response = requests.get('http://example.com').text
urls = url_pattern.findall(html_response)

我想所需的正则表达式(如果存在的话)会足够复杂以考虑一堆 url 的特殊情况,因此它不能是一些单行代码。

最佳答案

请改用 BeautifulSoup。它使用简单,并允许您使用 HTML 解析页面。

查看此答案 How to extract URLs from an HTML page in Python

关于python - 绝对 url 的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33047120/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com