仅提取这些链接的最佳方法是什么? 最佳答案 这个怎么样?-6ren">
gpt4 book ai didi

python - BeautifulSoup - 捕获特定类或文本的所有链接

转载 作者:行者123 更新时间:2023-12-04 22:58:47 27 4
gpt4 key购买 nike

我正在尝试从带有美丽汤的网页中捕获所有相关链接。我需要的所有链接都有 class="btn btn-gray"还有文字 <a...>More Info<>
仅提取这些链接的最佳方法是什么?

最佳答案

这个怎么样?

soup = BeautifulSoup(html, 'lxml')

all_links = []
links = soup.find_all('a', {'class': ['btn', 'btn-gray']})
for link in links:
if 'More Info' in link.text:
all_links.append(link['href']) # Save href only, for example.

或者作为一个干净的列表理解:
links = soup.find_all('a', {'class': ['btn', 'btn-gray']})
results = [link['href'] for link in links if 'More Info' in link.text]

关于python - BeautifulSoup - 捕获特定类或文本的所有链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32891933/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com