gpt4 book ai didi

python - 使用 BeautifulSoup 提取标签中的内容

转载 作者:IT老高 更新时间:2023-10-28 20:51:53 24 4
gpt4 key购买 nike

我想提取内容Hello world .请注意有多个 <table>和类似的<td colspan="2">在页面上也是如此:

<table border="0" cellspacing="2" width="800">
<tr>
<td colspan="2"><b>Name: </b>Hello world</td>
</tr>
<tr>
...

我尝试了以下方法:

hello = soup.find(text='Name: ')
hello.findPreviousSiblings

但它什么也没返回。

此外,我在提取 My home address 时也遇到了问题。 :

<td><b>Address:</b></td>

<td>My home address</td>

我也在用同样的方法搜索text="Address: "但是如何向下导航到下一行并提取 <td> 的内容?

最佳答案

contents运算符非常适合提取 text来自 <tag>text</tag> .


<td>My home address</td>示例:

s = '<td>My home address</td>'
soup = BeautifulSoup(s)
td = soup.find('td') #<td>My home address</td>
td.contents #My home address

<td><b>Address:</b></td>示例:

s = '<td><b>Address:</b></td>'
soup = BeautifulSoup(s)
td = soup.find('td').find('b') #<b>Address:</b>
td.contents #Address:

关于python - 使用 BeautifulSoup 提取标签中的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5999407/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com