gpt4 book ai didi

python - pandas 是如何计算索引的?

转载 作者:太空宇宙 更新时间:2023-11-04 03:10:13 25 4
gpt4 key购买 nike

我想将时间序列数据包含在来自 csv 的数据框中。我使用以下程序:

path = [r'C:\data_' + str(x) + ".csv" for x in range(1150, 1177)]
data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path)

data_df.head()

head

结果是这样的:

data_df.info()

indexes

索引(1 到 187481)与行数(5387507)不同怎么可能?

data_df.reset_index()

事情变得正常:

indexes corrected

那么初始指数是怎么计算出来的呢?

最佳答案

indexes有重复,因为DataFrame的每个indexconcat中都是从0开始的 函数。

作为MaxU注释,解决方案是将参数 ignore_index=True 添加到 concat - docs :

data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path, ignore_index=True)

关于python - pandas 是如何计算索引的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38269303/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com