- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
这给我带来了很多麻烦,我对numpy数组与pandas系列的不兼容感到困惑。例如,当我使用系列创建 bool 数组时
x = np.array([1,2,3,4,5,6,7])
y = pd.Series([1,2,3,4,5,6,7])
delta = np.percentile(x, 50)
deltamask = x- y > delta
delta mask 创建一个 bool pandas 系列。
但是,如果你这样做
x[deltamask]
y[deltamask]
你发现数组完全忽略了掩码。不会出现错误,但最终会得到两个不同长度的对象。这意味着像这样的操作
x[deltamask]*y[deltamask]
导致错误:
print type(x-y)
print type(x[deltamask]), len(x[deltamask])
print type(y[deltamask]), len(y[deltamask])
更令人困惑的是,我注意到运算符 < 的处理方式不同。例如
print type(2*x < x*y)
print type(2 < x*y)
会分别给你一个 pd.series 和 np.array。
此外,
5 < x - y
结果是一个系列,所以看起来系列优先,而系列掩码的 bool 元素在传递给 numpy 数组并产生切片数组时被提升为整数。
这是什么原因?
最佳答案
花式索引
就目前的 numpy 而言,numpy 中的花式索引工作方式如下:
如果括号之间的东西是tuple
(无论是否使用显式括号),元组的元素是 x
不同维度的索引。 .例如,x[(True, True)]
和 x[True, True]
会提高IndexError: too many indices for array
在这种情况下是因为 x
是一维的。但是,在异常发生之前,也会发出警告:VisibleDeprecationWarning: using a boolean instead of an integer will result in an error in the future
.
如果括号之间的东西正好一个ndarray
,不是子类或其他类似数组,并且具有 bool 类型,它将被用作掩码。这就是为什么 x[deltamask.values]
给出了预期的结果(空数组,因为 deltamask
都是 False
。
如果括号之间的东西是任何类似数组的东西,是否是像Series
这样的子类或者只是一个 list
,或其他东西,它被转换为 np.intp
数组(如果可能)并用作整数索引。所以x[deltamask]
产生相当于 x[[False] * 7]
的东西或者只是 x[[0] * 7]
.在这种情况下,len(deltamask)==7
和 x[0]==1
所以结果是[1, 1, 1, 1, 1, 1, 1]
.
这种行为是违反直觉的,FutureWarning: in the future, boolean array-likes will be handled as a boolean array index
它生成表明修复正在进行中。当我发现/对 numpy 进行任何更改时,我将更新此答案。
此信息可以在 Sebastian Berg 对我在 Numpy 讨论中的初始查询的回复中找到 here .
关系运算符
现在让我们来解决您的问题的第二部分,即比较的工作原理。关系运算符( <
、 >
、 <=
、 >=
)通过在被比较的对象之一上调用相应的方法来工作。对于 <
这是__lt__
.但是,不仅仅是调用 x.__lt__(y)
对于表达式 x < y
, Python 实际上检查被比较对象的类型。如果y
是 x
的子类型实现比较,那么 Python 更喜欢调用 y.__gt__(x)
相反,无论您如何编写原始比较。唯一的方法x.__lt__(y)
如果 y
将被调用是 x
的子类如果y.__gt__(x)
返回 NotImplemented
表示不支持该方向的比较。
当您执行 5 < x - y
时会发生类似的事情.同时 ndarray
不是 int
的子类, 比较 int.__lt__(ndarray)
返回 NotImplemented
,所以 Python 实际上最终调用了 (x - y).__gt__(5)
,这当然是定义好的并且工作得很好。
所有这些的更简洁的解释可以在 Python docs 中找到.
关于python - 用 bool 数组掩盖系列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39145795/
我有一个带有列的表提供者 implied(tiny int)(something like nullable bool) provi
我正在阅读 VideoFileWriter来自 AForge.Video.FFMPEG 的类(class)通过 ILSPY 组装(我很想看看特定方法是如何工作的)并发现了这个: public bool
这是我的完整代码... import 'package:flutter/cupertino.dart'; import 'package:flutter/material.dart'; import
我有一个输入 list类型 [Maybe SomeType]和一个谓词 p类型 SomeType -> Bool ,我想回答这个问题“谓词 p 是否适用于所有碰巧在输入中的 SomeType ?”。
使用 !!x 有什么区别吗?对比(bool)x ? 假设__STDC_VERSION__ >= 199901L和 #include 他们都保证结果是0吗?或 1 ,并且无论 x 的大小和值如何,都不
我正在编写一些 C++ 代码,我想调用两个函数(checkXDirty 和 checkYDirty),并返回 true如果任一返回 true。即使一个返回 true 我也需要评估两者,所以我的第一个想
我注意到 bool在 QtCreator 中以不同于其他类型的颜色突出显示: 只有在包含某些 header 时才会发生这种情况,最终我将其追踪到 . QtCreator 的代码检查器似乎无法手动跟踪
有一个函数: func (first: Int) -> Int -> Bool -> String { return ? } 返回值怎么写?我对上面 func 的返回类型感到很困惑。 最
训练神经网络学习“异或” 我正在尝试使用“批量归一化”,我创建了一个批量归一化层函数“batch_norm1”。 import tensorflow as tf import nump
我已经创建了任务函数来验证我的 json 文件。一切正常,直到我没有使用结果。当我试图从 async task function 获得结果时它显示错误为 Cannot implicitly conve
我有一个函数 func login (parameters: [(String, Any)], completion: @escaping (Bool) -> Vo
我正在处理最近从 X/Motif 转移到 Qt 的 C++ 代码库。我正在尝试编写一个 Perl 脚本,它将用 bool 替换所有出现的 Boolean(来自 X)。该脚本只是做了一个简单的替换。 s
嗨,我正尝试创建一个Visiblity小部件,如果用户在Firebase数据库阵列上,该小部件将显示。看起来像这样(成员数组): 如您所见,我创建了一个StreamBuilder,如果当前用户的用户名
我创建了如下的rest api方法, Future activateAccount(int id, int code) async{ final body = {"code": '$c
在我的Flutter应用中,我有一个返回Future的函数,但我想将结果作为Stream。这是函数: Future isGpsOn() async { if (await Geolocat
我可以看到 BOOLEAN 覆盖了 __visit_name__ class BOOLEAN(Boolean): __visit_name__ = 'BOOLEAN' 控制调度员选择的访问者方
考虑以下代码: bool x; bool? y = null; x = y?? true; 将 bool? 分配给 bool 是一个编译时错误,但上面的代码在编译和运行时都成功了。为什么?尽管第三条语
我正在重写一些 Javascript 代码以在 Excel VBA 中工作。由于在这个网站上搜索,我已经设法翻译了几乎所有的 Javascript 代码!但是,有些代码我无法准确理解它在做什么。这是一
我想拍一张bool来自Vec并在 if 语句中进行比较。如何解决以下错误? | 7 | if cell { | ^^^^ expected
我在我的应用程序崩溃跟踪工具中发现了一些崩溃。基本上我有一个 tabBarController,其中一个选项卡有一个嵌入式 UIWebView,另一个选项卡有一个带有 UITableView 的 Co
我是一名优秀的程序员,十分优秀!