gpt4 book ai didi

python - findAll 函数 BeautifulSoup

转载 作者:太空宇宙 更新时间:2023-11-03 18:56:36 24 4
gpt4 key购买 nike

我一直在尝试解析存储在 <td> 之间的文本元素标签,例如:

<tr>
<td>Trading Hours</td>
<td><b>Monday</b> <br />
London - 23:00 Sunday - 23:00 Monday<br />
New York - 18:00 Sunday - 18:00 Monday<br />
Chicago - 17:00 Sunday - 17:00 Monday<br />
<br />
<b>Tuesday-Friday</b> <br />
London - 01:00 - 23:00<br />
New York - 20:00 - 18:00<br />
Chicago - 19:00 - 17:00<br />
</td>
</tr>

在这个简单的例子中,只有 2 <td>标签并假设一个变量 tr存储整个 html 代码块。我提取文本的逻辑如下(没有任何 <tr><br> 标签):

for td in tr.findAll('td'):
row.append((td.find('td', text = True)).strip().strip('\n'))

问题:我的for循环识别第一个 <td>标签,但不是第二个。我该如何改进?

最佳答案

text=True 告诉 BeautifulSoup 寻找带有文本的元素。如果想要获取文本,需要使用.get_text():

td.find('td', text=True).get_text(strip=True)

关于python - findAll 函数 BeautifulSoup,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17136692/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com