gpt4 book ai didi

python - 用 BeautifulSoup 抓取表格,如何用换行符分隔元素?

转载 作者:行者123 更新时间:2023-12-04 15:07:59 26 4
gpt4 key购买 nike

这是我的 HTML 表格的行的样子:

<tr class='row'><td>100
<td >George</a>
<td class=a>123<td class=a>321
<td>Alby<td>Dalton

这是我的 python 代码:

for tr in tabel.find('tr'):
td = tr.find('td')
print(td.text)

我的输出:

100
George
123321
AlbyDalton

我想要得到的输出:

100
George
123
321
Alby
Dalton

最佳答案

您可以使用 get_text()添加换行符 \n 作为 separator 参数的方法。

from bs4 import BeautifulSoup

html = """
<tr class='row'><td>100
<td >George</a>
<td class=a>123<td class=a>321
<td>Alby<td>Dalton
"""
soup = BeautifulSoup(html, "html.parser")

for tag in soup.find_all("tr", class_="row"):
print(tag.get_text(separator="\n", strip=True))

输出:

100
George
123
321
Alby
Dalton

关于python - 用 BeautifulSoup 抓取表格,如何用换行符分隔元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65727862/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com