gpt4 book ai didi

python - Beautiful Soup 过滤关键字/属性 (python)

转载 作者:行者123 更新时间:2023-12-01 01:06:59 24 4
gpt4 key购买 nike

我想使用 Beautiful Soup 和 requests 来抓取网站的数据,我几乎得到了我想要的,但我找不到过滤最后步骤的方法:

这是我的代码:

variants = soup.find('div', class_='product-configure')
print(variants)

这将打印以下内容:

<div class="product-configure">
<select id="custom-variants">
<option disabled="disabled" selected="selected">Maak een keuze</option>
<option data-status="available" data-value="177379037">Size : EU 40.5 (US 7)
</option>
<option data-status="available" data-value="177379043">Size : EU 41.5 (US 8)
</option>
<option data-status="available" data-value="177379223">Size : EU 42.5 (US 9)
</option>
</select>
</div>

如何过滤它,使其仅打印“数据值”中的所有数字?(例如“177379037”作为第一行的输出)

这是 HTML:

          <div class="gui-select">
<div class="product-configure">
<select id="custom-variants">
<option selected="selected" disabled="disabled">Select an option</option>
<option data-value="177379037" data-status="available">Size : EU 40.5 (US 7)</option>
<option data-value="177379043" data-status="available">Size : EU 41.5 (US 8)</option>
<option data-value="177379223" data-status="available">Size : EU 42.5 (US 9)</option>


</div>

最佳答案

您可以使用 soup.find_all() 并使用带有属性的字典

options = soup.find_all("option", {"data-value": True})

结果:

for o in options:
print(o.attrs["data-value"])
<小时/>
177379037
177379043
177379223

关于python - Beautiful Soup 过滤关键字/属性 (python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55246248/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com