gpt4 book ai didi

python - 如何使用 BeautifulSoup 查找指向特定域的页面中的所有链接?

转载 作者:太空狗 更新时间:2023-10-30 00:52:27 27 4
gpt4 key购买 nike

如何使用 BeautifulSoup 查找指向特定域的页面中的所有链接?

最佳答案

使用 SoupStrainer,

from BeautifulSoup import BeautifulSoup, SoupStrainer
import re

# Find all links
links = SoupStrainer('a')
[tag for tag in BeautifulSoup(doc, parseOnlyThese=links)]

linkstodomain = SoupStrainer('a', href=re.compile('example.com/'))

编辑:从官方文档修改示例。

关于python - 如何使用 BeautifulSoup 查找指向特定域的页面中的所有链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2151365/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com