gpt4 book ai didi

python - Pandas Concat 增加行数

转载 作者:行者123 更新时间:2023-11-28 22:18:38 31 4
gpt4 key购买 nike

我正在连接两个数据帧,所以我想将一个数据帧定位到另一个数据帧。但首先我对初始数据框做了一些转换:

scaler = MinMaxScaler() 
real_data = pd.DataFrame(scaler.fit_transform(df[real_columns]), columns = real_columns)

然后连接:

categorial_data  = pd.get_dummies(df[categor_columns], prefix_sep= '__')
train = pd.concat([real_data, categorial_data], axis=1, ignore_index=True)

我不知道为什么,但是行数增加了:

print(df.shape, real_data.shape, categorial_data.shape, train.shape)
(1700645, 23) (1700645, 16) (1700645, 130) (1703915, 146)

发生了什么以及如何解决问题?

如您所见,train 的列数等于 real_data 和 categorial_data 列的总和

最佳答案

问题是,有时当您对单个数据框对象执行多个操作时,索引会保留在内存中。所以使用 df.reset_index() 将解决您的问题。

关于python - Pandas Concat 增加行数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50368145/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com