gpt4 book ai didi

python - 抓取时如何限制结果的数量

转载 作者:太空宇宙 更新时间:2023-11-04 04:08:41 24 4
gpt4 key购买 nike

我试图抓取一个网站及其工作,但我想限制出现的结果数量。我该怎么做?

req = requests.get('https://www.imdb.com/list/ls026573448/')
soup2 = bs4.BeautifulSoup(req.text,)

def pressed(self, instance):
genre = self.genre.text
if genre == 'Horror' or 'horror':
soup2.select('h3')
for x in soup2.select('h3'):
print(x.text)

当我运行这段代码时,会出现大约 50 个结果。我如何将其限制为 20 或 15?

最佳答案

这是一个使用 :has 和 :contains 隔离适当元素然后使用 limit 停止在 20 的示例(感谢@facelessuser 指出)。这是 bs4 4.7.1。

from bs4 import BeautifulSoup
import requests

r = requests.get('https://www.imdb.com/list/ls026573448/')
soup = bs(r.content, 'lxml')
films = [item.text for item in soup.select('.lister-item-header:has(~ p:has(.genre:contains("Horror"))) a', limit = 20)]
print(films)

关于python - 抓取时如何限制结果的数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56783942/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com