gpt4 book ai didi

python - Pandas - 仅获取某些值的假人

转载 作者:太空狗 更新时间:2023-10-30 00:16:54 26 4
gpt4 key购买 nike

我有一个包含 10000 行的 Pandas 系列,其中填充了一个字母表,从 A 到 Z。但是,我想使用 Pandas get_dummies 仅为 A、B 和 C 创建虚拟数据框。我该怎么做?

我不想为列中的所有行值获取虚拟值,然后选择特定的列,因为该列包含最终导致内存错误的其他冗余数据。

最佳答案

试试这个:

# create mock dataframe
df = pd.DataFrame( {'alpha':['a','a','b','b','c','e','f','g']})

# use replace with a regex to set characters d-z to None
pd.get_dummies(df.replace({'[^a-c]':None},regex =True))

输出:

  alpha_a   alpha_b     alpha_c
0 1 0 0
1 1 0 0
2 0 1 0
3 0 1 0
4 0 0 1
5 0 0 0
6 0 0 0
7 0 0 0

关于python - Pandas - 仅获取某些值的假人,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33503724/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com