gpt4 book ai didi

python - 使用 read_excel 时,Pandas 不断重复行

转载 作者:行者123 更新时间:2023-12-01 06:35:03 29 4
gpt4 key购买 nike

我使用 read_excel() 将 xlsx 电子表格转换为数据框。它通常工作正常,但对于此电子表格,当我导入它并尝试使用 df["Date"] 列出所有值时,它似乎会多次重复每个日期。知道这是为什么吗?

    df = pd.read_excel("data.xlsx", sheet_name="Data")
dates = df['Date']

结果:

    0        2014-12-22
1 2014-12-22
2 2014-12-22
3 2014-12-22
4 2014-12-22
...
419532 2020-01-10
419533 2020-01-10
419534 2020-01-10
419535 2020-01-10
419536 2020-01-10

编辑:电子表格的一些内容:

enter image description here正如您所看到的,日期是重复的,它们绝对不像我的电子表格中的那样。知道为什么吗?谢谢

最佳答案

pd.read_excel() 将读取整个工作表,除非您将其限制在有限范围内。 Excel 有许多函数可以更改工作表的显示,而无需更改工作表中存在的数据(过滤、隐藏行等)。因此,额外的行是工作表中存在但已隐藏的数据。腹肌

一些明显的迹象是过滤器按钮中是否包含过滤符号、蓝色行号和隐藏行,如下所示。

enter image description here

检查以确保您可以看到所有数据,以便了解工作表中的内容而不是仅可见的内容。

要获得与您拥有的相同的 View ,您可以使用条件过滤数据框。

df = df[df['city'] == 'CALGARY']

或多个条件:

df = df[(df['city'] == 'CALGARY') & (df['utility'] == 'Suncor')]

关于python - 使用 read_excel 时,Pandas 不断重复行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59709941/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com