gpt4 book ai didi

python - 如何使用 Beautiful Soup 查找 ID 不断变化的标签?

转载 作者:太空狗 更新时间:2023-10-30 03:05:30 25 4
gpt4 key购买 nike

我在 Python 中使用 Beautiful Soup。

这是一个示例网址:

http://www.locationary.com/place/en/US/Ohio/Middletown/McDonald%27s-p1013254580.jsp

在 HTML 中,有一堆标签,我可以指定要查找哪些标签的唯一方法是使用它们的 ID。我唯一想找到的是电话号码。标签看起来像这样:

<td class="dispTxt" id="value_xxx_c_1_f_8_a_134242498">5134231582</td> 

我去过同一网站上的其他网址,每次都发现几乎相同的电话号码标签 ID。始终保持不变的部分是:

'value_xxx_c_1_f_8_a_'

但是,之后的数字总是会发生变化。有没有一种方法可以告诉 Beautiful Soup 查找 id 的一部分并匹配它,让另一部分像正则表达式一样是数字?

此外,一旦我获得标签,我想知道...如何在不使用正则表达式的情况下提取电话号码?我不知道 Beautiful Soup 是否可以做到这一点,但它可能比正则表达式更简单。

最佳答案

您可以使用正则表达式(此示例匹配标签名称,您需要调整它以匹配元素的 id):

import re
for tag in soup.find_all(re.compile("^value_xxx_c_1_f_8_a_")):
print(tag.name)

关于python - 如何使用 Beautiful Soup 查找 ID 不断变化的标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11924135/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com