gpt4 book ai didi

python - 如何使用Python Beautiful Soup获取html的标签名称?

转载 作者:行者123 更新时间:2023-12-01 01:26:39 26 4
gpt4 key购买 nike

header = head.find_all('span')

[<span itemprop="name">Raj</span>, <span itemprop="street">24 Omni Street</span>, <span itemprop="address">Ohio</span>, <span itemprop="Region">US</span>, <span itemprop="postal">40232</span>, <span class="number">334646344</span>]

print (header[0].tag)
print(header[0].text)

####output
None
Raj
...

####Expected output
Name
Raj
...

我无法提取 span itemprop 的所有值。它没有输出。我做错了什么吗?

谢谢,拉杰

最佳答案

是的,class 'bs4.element.Tag'没有 tag 属性,因为它本身一个Tag。来自文档:

You can access a tag’s attributes by treating the tag like a dictionary.

因此,您已经获得了所有 span 标记的列表,现在只需迭代该列表并获取所需的属性(即 'itemprop'):

spans = head.find_all('span')

for span in spans:
try:
print(span['itemprop'].decode().title() + ': ' + span.text)
except KeyError:
continue

输出:

Name: Raj
Street: 24 Omni Street
Address: Ohio
Region: US
Postal: 40232

根据需要格式化输出或存储数据

关于python - 如何使用Python Beautiful Soup获取html的标签名称?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53271163/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com