gpt4 book ai didi

python - BeautifulSoup 4 解析属性错误

转载 作者:太空宇宙 更新时间:2023-11-03 19:08:19 25 4
gpt4 key购买 nike

我正在尝试解析 HTML 文档,但 bs4 无法解析特定标记中的属性:

<select class="inputNormal" id="TipoImmobileDaNonImportare" name="TipoImmobileDaNonImportare" style="width:100%">
<option value=""></option>
<option value="unità immobiliare urbana">unità immobiliare urbana</option>
<option value="particella terreni">particella terreni</option>
</select>

当我打印时,出现错误

AttributeError: 'tuple' object has no attribute 'items'`
the tag and attribute i print:`select: (u'style', u'class', u'name')`
instead of (for example): `input: {u'type': u'hidden', u'name': u'Immobile_Note', u'value': u'Ubicazione occupazione', u'id': u'Immobile_Note'}`
<小时/>

更新: 如果我尝试 soup.find_all( attrs= {'id' : 'somevalue' } ) 它会失败,因为尝试访问树的所有属性!

如果我尝试:

s = BeautifulSoup( """<select class="inputNormal" id="TipoImmobileDaNonImportare" name="TipoImmobileDaNonImportare" style="width:100%">
<option value=""></option>
<option value="unità immobiliare urbana">unità immobiliare urbana</option>
<option value="particella terreni">particella terreni</option>
</select>""")

解析器正确检测到它:

select: {'id': 'TipoImmobileDaNonImportare', 'style': 'width:100%', 'class': ['inputNormal'], 'name': 'TipoImmobileDaNonImportare'}

我尝试用lxml解析器和html5lib解析器解析它,但结果是一样的。

感谢您的回复。

编辑:感谢阿曼达,但我的代码中有一个错误,我尝试在 tag.attrs 中存储一个 touple 对象,因为此代码正在从 bs3 移植到 bs4!谢谢。

最佳答案

我不完全确定您在这里尝试使用 Beautiful Soup 访问什么,但如果您想获取选择或选项的属性,您可以执行以下操作:

html = """<select class="inputNormal" id="TipoImmobileDaNonImportare" name="TipoImmobileDaNonImportare" style="width:100%">
<option value=""></option>
<option value="unità immobiliare urbana">unità immobiliare urbana</option>
<option value="particella terreni">particella terreni</option></select>"""

soup = BeautifulSoup(html)

您可以使用以下方式显示第一个“选择”的属性:

print soup.find('select').attrs

或者显示所有选项的属性:

for option in soup.find_all('option'):
print option.attrs

或者,如果您正在查找可用项目的名称,请使用:

for option in soup.find_all('option'):
print option.text

或者如果您想要选项值而不是显示的文本,请使用:

for option in soup.find_all('option'):
print option['value']

如果这没有帮助,也许您可​​以给出您期望的输出的示例

关于python - BeautifulSoup 4 解析属性错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13876834/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com