gpt4 book ai didi

python - 如何在python中解析html表格

转载 作者:行者123 更新时间:2023-12-05 09:08:47 32 4
gpt4 key购买 nike

我是解析表和正则表达式的新手,你能帮忙用python解析这个吗:

<table callspacing="0" cellpadding="0">
<tbody><tr>
<td>1text&nbsp;2text</td>
<td>3text&nbsp;</td>
</tr>
<tr>
<td>4text&nbsp;5text</td>
<td>6text&nbsp;</td>
</tr>
</tbody></table>

我需要“3text”和“6text”

最佳答案

您可以使用 CSS 选择器 select()select_one() 来获取“3text”和“6text”,如下所示:

import requests
from bs4 import BeautifulSoup
html_doc='''
<table callspacing="0" cellpadding="0">
<tbody><tr>
<td>1text&nbsp;2text</td>
<td>3text&nbsp;</td>
</tr>
<tr>
<td>4text&nbsp;5text</td>
<td>6text&nbsp;</td>
</tr>
</tbody></table>
'''

soup = BeautifulSoup(html_doc, 'lxml')
soup1 = soup.select('tr')

for i in soup1:
print(i.select_one('td:nth-child(2)').text)

你也可以使用find_all方法:

trs = soup.find('table').find_all('tr')

for i in trs:
tds = i.find_all('td')
print(tds[1].text)

结果:

3text 
6text

关于python - 如何在python中解析html表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63030178/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com