gpt4 book ai didi

python - Beautifulsoup 的输出

转载 作者:太空宇宙 更新时间:2023-11-04 06:35:43 26 4
gpt4 key购买 nike

我正在尝试使用 beautifulsoup 解析一个简单的 html 表格,但我遇到了一些问题

这是我的输入

<table id="people" class="tt" width="99%" border="0" cellpadding="0" cellspacing="1">
<tr>
<td colspan="3" bgcolor="#d3d3d3">
<p align="center" style="border: 1px solid #c0c0c0; padding: 0.02in">
<a name="faculty">
</a>
<b>
Faculty
</b>
</p>
</td>
</tr>
<tr>
<td>
<p align="center">
<font color="#000080">
<a href="http://www.website.com/%7Empop">
<font color="#000080">
<img src="images/mpop.jpg" name="graphics1" align="bottom" width="70" height="85" border="1" />
</font>
</a>
</font>
</p>
</td>
<td>
<p>
<b>
John Doe, Ph.D.
</b>
<br />
Associate Professor, Computer
Science
<br />

</p>
</td>
<td>
<p>
Office: Sciences Bldg.
<br />
Phone:
xxx-xxx-xxxx
<br />
jd [at] website.com
<br />
</p>
</td>
</tr>
<tr>
<td>
<p align="center">
<font color="#000080">
<a href="http://www.website.com/%7Ercolwell">
<font color="#000080">
<img src="images/rcolwell.jpg" name="graphics2" align="bottom" width="70" height="97" border="1" />
</font>
</a>
</font>
</p>
</td>
<td>
<p>
<b>
Jane Doe, Ph.D.
</b>
<br />
Professor
<br />
School of Public Health
<br />
</p>
</td>
<td>
<p>
Sciences Bldg
<br />
jd [at]
website.com
<br />

</a>
</p>
</td>
</tr>
</table>

这是我的代码

t = soup.findAll("table",id="people")
for table in t:
rows = table.findAll("tr")
for tr in rows:
cols = tr.findAll("td")
for td in cols:
print(str(td.find(text=True))) # tried also print(td.find(text=True))
print(",")
print("\n")

这将生成只有逗号而实际上没有文本的输出,但是当我输入 print(td) 时,我确实找到了我需要输出的信息,但是以带有所有标签的 html 格式,可以有人指出我在这里做正确的事吗?我只想提取单元格内容。

干杯

最佳答案

也许您正在寻找 s.t.像这样:

from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup("<table id=people><tr><td>x<a>y</a>z</td><td>x<a>y</a>z</td></tr></table>")
t = soup.findAll("table",id="people")
for table in t:
rows = table.findAll("tr")
for tr in rows:
cols = tr.findAll("td")
print(','.join([td.text for td in cols]))

或者,您可以使用 u''.join(map(unicode, td.contents)),具体取决于您想要打印的内容。

关于python - Beautifulsoup 的输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11476911/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com