gpt4 book ai didi

python - 如何连接 pandas.read_html 的结果列表

转载 作者:太空宇宙 更新时间:2023-11-04 02:28:14 26 4
gpt4 key购买 nike

我可以使用下面的代码从一个 URL 打印/获取 CSV 数据框

import bs4 as bs
import pandas as pd

dfs = pd.read_html('http://www.url1.com',header=0)


for df in dfs:
print(df.head())
df.to_csv('File.csv')

我想将多个数据帧连接成一个。

将所有数据帧合并为一个数据帧并将其导出到“file.csv”。

最佳答案

您可以使用 pandas.concat 连接数据帧:

import pandas as pd

urls = ['http://www.url1.com',
'http://www.url2.com',
'http://www.url3.com']

df = pd.concat([pd.concat(pd.read_html(url, header=0), axis=0) for url in urls], axis=0)

df.to_csv('file.csv')

解释

  • pd.concat 连接数据帧列表。
  • pd.read_html 返回数据帧列表。
  • 因此,要连接数据帧列表的列表,即 pd.read_html 输出列表,您需要使用嵌套的 pd.concat

关于python - 如何连接 pandas.read_html 的结果列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49834916/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com