python - 如何在没有迭代的情况下基于 Pandas 中的 2+ 个条件创建一个新的 df.column？-6ren

python - 如何在没有迭代的情况下基于 Pandas 中的 2+ 个条件创建一个新的 df.column？

转载作者：太空宇宙更新时间：2023-11-03 11:51:32

我有一个正常的df

 A = pd.DataFrame([[1, 5, 2], [2, 4, 4], [3, 3, 1], [4, 2, 2], [5, 1, 4]],
                  columns=['A', 'B', 'C'], index=[1, 2, 3, 4, 5])

如果我想根据另一列中的条件创建一个列，我会执行类似的操作，并且会按预期工作。

 In [5]: A['D'] = A['C'] > 2
 In [6]: A
 Out[6]: 
   A  B  C      D
1  1  5  2  False
2  2  4  4   True
3  3  3  1  False
4  4  2  2  False
5  5  1  4   True

但是，如果我想使用 2 个条件来做同样的事情......比如:

A['D'] = A['C'] > 2 and A['B'] > 2      or     A['D'] = A['C'] > 2 & A['B'] > 2

我得到了臭名昭著的

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

如何在不迭代的情况下求解？基于两个条件创建此新列的目的是能够使用以下类型的 groupby 函数:

A.groupby('D').apply(custom_fuction)

所以，也许有一种方法可以使用 groupby 来完成整个事情，但我不知道该怎么做。

谢谢

最佳答案

使用&，而不是and，来执行元素逻辑与操作:

In [40]: A['D'] = (A['C'] > 2) & (A['B'] > 2)

In [41]: A
Out[41]: 
   A  B  C      D
1  1  5  2  False
2  2  4  4   True
3  3  3  1  False
4  4  2  2  False
5  5  1  4  False

您也可以跳过定义 D 列:

In [42]: A.groupby((A['C'] > 2) & (A['B'] > 2))
Out[42]: <pandas.core.groupby.DataFrameGroupBy object at 0xab5b6ac>

关于python - 如何在没有迭代的情况下基于 Pandas 中的 2+ 个条件创建一个新的 df.column？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26203723/

文章推荐： MySQL 先排序还是结果排序

文章推荐： c# - 已超出 Notes 可支持的最大内存段数

文章推荐： mysql - 为什么不正确地命令 asc？

文章推荐： python - Flask-ReSTLess order_by相关模型

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何在没有迭代的情况下基于 Pandas 中的 2+ 个条件创建一个新的 df.column？