gpt4 book ai didi

python - Pandas读取html表到dataframe无法打印

转载 作者:行者123 更新时间:2023-12-01 06:46:16 24 4
gpt4 key购买 nike

我通过像这样使用 beautifulsoup 来获取 html 表。

alltable = bt.find_all('table')
print(alltable)

它显示这样的输出。

[<table>
<thead>
<tr><th>ID</th><th>Name</th><th>User</th></tr>
</thead>
<tbody>

<tr valign="TOP">
<td><a href="/printers/PDF">PDF</a>-1 </td>
<td>Test </td>
<td>User1 </td>
</tr>

<tr valign="TOP">
<td><a href="/printers/PDF">PDF</a>-2 </td>
<td>Test </td>
<td>User1 </td>
</tr>

<tr valign="TOP">
<td><a href="/printers/PDF">PDF</a>-3 </td>
<td>Document1 </td>
<td>User1 </td>
</tr>

</tbody>
</table>]

我将 html 表读取到数据框并像这样打印。

df = pd.read_html(str(alltable))
print(df['Name'])

它显示这样的错误。

TypeError: list indices must be integers or slices, not str

如何解决?

最佳答案

Panda's read_html返回 DataFrame 对象的列表 - 而不是单个 DataFrame 对象。在您的情况下,您需要索引到列表的唯一元素:

>>> df[0]['Name']
0 Test
1 Test
2 Document1
Name: Name, dtype: object

关于python - Pandas读取html表到dataframe无法打印,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59206229/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com