gpt4 book ai didi

python-3.x - 标准化 Pandas 数据框但跳过几列

转载 作者:行者123 更新时间:2023-12-03 20:31:07 25 4
gpt4 key购买 nike

我正在使用以下代码来规范化数字 Pandas 数据框。

df_norm = (input_df - input_df.mean()) / (input_df.max() - input_df.min())

现在我有了一个新的数据框,前两列是字符串。我想忽略前两列并对数据框的其余部分执行规范化。有没有办法通过小的修改来重用上面的代码?谢谢!

最佳答案

您可以使用第二列的切片 -

s0 = input_df.iloc[:,2:]
input_df.iloc[:,2:] = (s0 - s0.mean()) / (s0.max() - s0.min())

sample 运行 -
In [274]: input_df
Out[274]:
0 1 2 3
0 foo1 doo1 0.880515 0.307642
1 foo2 doo2 0.774307 0.229650
2 foo3 doo3 0.189846 0.283218

In [275]: s0 = input_df.iloc[:,2:]
...: input_df.iloc[:,2:] = (s0 - s0.mean()) / (s0.max() - s0.min())
...:

In [276]: input_df
Out[276]:
0 1 2 3
0 foo1 doo1 0.384592 0.437719
1 foo2 doo2 0.230817 -0.562281
2 foo3 doo3 -0.615408 0.124563

或者,要创建新的输出,我们可以连接 -
ss,s0 = np.split(input_df,[2],axis=1)
df_out = pd.concat([ss,(s0 - s0.mean()) / (s0.max() - s0.min())],axis=1)

关于python-3.x - 标准化 Pandas 数据框但跳过几列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46454076/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com