gpt4 book ai didi

python - 将 Excel 格式化为 DataFrame

转载 作者:行者123 更新时间:2023-12-04 20:50:24 26 4
gpt4 key购买 nike

excel sheet snapshot
请看一下我附在左上角的 Excel 表格快照。当我从这张表创建一个 DataFrame 时,我的第一列和第一行都填充了 NaN .我需要跳过这个空白行和列来选择创建 DataFrame 的第二行和列。

    Unnamed: 0  Unnamed: 1  Unnamed: 2  Unnamed: 3
0 NaN ID SCOPE TASK
1 NaN 34 XX something_1
2 NaN 534 SS something_2
3 NaN 43 FF something_3
4 NaN 32 ZZ something_4
我希望我的 DataFrame 看起来像这样
0   ID         SCOPE       TASK
1 34 XX something_1
2 534 SS something_2
3 43 FF something_3
4 32 ZZ something_4
我尝试了这段代码,但没有得到我所期望的
df = pd.read_excel("Book1.xlsx")
df.columns = df.iloc[0]
df.drop(df.index[1])
df.head()



NaN ID SCOPE TASK
0 NaN ID SCOPE TASK
1 NaN 34 XX something_1
2 NaN 534 SS something_2
3 NaN 43 FF something_3
4 NaN 32 ZZ something_4
我仍然需要从这里删除第一列和 0 索引行。
任何人都可以帮忙吗?

最佳答案

使用 header 指定将成为数据帧标题(列名)的行号范围;在您的情况下为 1。此外,使用 usecols 指定列名参数,在您的情况下,它们是“ID”、“SCOPE”和“TASK”。

df = pd.read_excel('your_excel_file.xlsx', header=1, usecols=['ID','SCOPE', 'TASK'])
查看 headerusecols来自 here .

关于python - 将 Excel 格式化为 DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65196114/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com