gpt4 book ai didi

python - 在 Pandas DataFrame 中使用 set_index

转载 作者:太空狗 更新时间:2023-10-29 20:20:19 24 4
gpt4 key购买 nike

使用导入的 CSV 文件,我像这样索引了 DataFrame...

 rdata.set_index(['race_date', 'track_code', 'race_number', 'horse_name'])

这就是 DataFrame 的一部分的样子......

 race_date  track_code race_number horse_name          work_date  work_track
2007-08-24 BM 8 Count Me Twice 2007-05-31 PLN
Count Me Twice 2007-06-09 PLN
Count Me Twice 2007-06-16 PLN
Count Me Twice 2007-06-23 PLN
Count Me Twice 2007-08-05 PLN
Judge's Choice 2007-06-07 BM
Judge's Choice 2007-06-14 BM
Judge's Choice 2007-07-08 BM
Judge's Choice 2007-08-18 BM

为什么“horse_name”列不像日期、赛道和比赛那样分组?也许这是设计使然,因此我如何才能通过竞争将这个更大的 DataFrame 切片以获得一个以“horse_name”作为其索引的新 DataFrame?

最佳答案

这不是错误。这正是它的预期工作方式。

DataFrame 必须显示其数据中的每一项。因此,如果索引有一个级别,则该级别将完全展开。如果它有两层,第一层将被分组,第二层将完全展开,如果它有树层,前两层将被分组,第三层将被展开,依此类推。

所以这就是马名不分组的原因。如果您还按马名分组,您将如何看到 DataFrame 中的所有项目:)

尝试做:

 rdata.set_index(['race_date', 'track_code', 'race_number'])

或:

 rdata.set_index(['race_date', 'track_code'])

您会看到索引的最后一级始终完全展开,使您能够看到 DataFrame 中的所有项目。

关于python - 在 Pandas DataFrame 中使用 set_index,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18071222/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com