gpt4 book ai didi

python - 使用条件,在 pandas DataFrame 中选择所需的列

转载 作者:太空宇宙 更新时间:2023-11-04 04:40:36 25 4
gpt4 key购买 nike

我有一个使用 pandas 创建的 DataFrame,我想基于原始表创建新表,但要根据特定条件进行过滤。

df = pd.DataFrame(
[['Y', 'Cat', 'no', 'yes', 6],
['Y', 4, 7, 9, 'dog'],
['N', 6, 4, 6, 'pig'],
['N', 3, 6, 'beer', 8]],
columns = ('Data', 'a', 'b', 'c', 'd')
)

我的条件不起作用:

if (df['Data']=='Y') & (df['Data']=='N'):
df3=df.loc[:,['Data', 'a', 'b', 'c']]
else:
df3=df.loc[:,['Data', 'a', 'b']]

我希望新表包含符合以下条件的数据:

如果 df.Data 有值 'Y' 和 'N',新表获取列 ('Data', 'a', 'b')

如果不是,则新表获取列 ('Data', 'a', 'b', 'c')

 Data    a   b
0 Y Cat no
1 Y 4 7
2 N 6 4
3 N 3 6

Data a b c
0 Y Cat no yes
1 Y 4 7 9
2 Y 6 4 6
3 Y 3 6 beer

最佳答案

您正在将一个系列与一个字符进行比较,而不是检查单个 bool 结果是否存在。相反,您可以使用 pd.Series.any 如果系列中的任何值为 True 则返回 True:

if (df['Data']=='Y').any() & (df['Data']=='N').any():
# do something

另一种方法是使用带有三元语句的 pd.DataFrame.drop:

df = df.drop(['d'] if set(df['Data']) == {'Y', 'N'} else ['c', 'd'], 1)

print(df)

Data a b c
0 Y Cat no yes
1 Y 4 7 9
2 N 6 4 6
3 N 3 6 beer

关于python - 使用条件,在 pandas DataFrame 中选择所需的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50724040/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com