- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有两个 numpy 掩码数组:
>>> x
masked_array(data = [1 2 -- 4],
mask = [False False True False],
fill_value = 999999)
>>> y
masked_array(data = [4 -- 0 4],
mask = [False True False False],
fill_value = 999999)
如果我尝试将 x
除以 y
,当其中一个操作数被屏蔽时,除法运算实际上并没有执行,所以我没有得到除法 -零误差。
>>> x/y
masked_array(data = [0.25 -- -- 1.0],
mask = [False True True False],
fill_value = 1e+20)
如果我定义自己的除法函数 div
,这甚至可以工作:
>>> def div(a,b):
return a/b
>>> div(x, y)
masked_array(data = [0.25 -- -- 1.0],
mask = [False True True False],
fill_value = 1e+20)
但是,如果我用 vectorize
包装我的函数,函数将在屏蔽值上调用,我会收到错误消息:
>>> np.vectorize(div)(x, y)
Traceback (most recent call last):
File "<input>", line 1, in <module>
File "/usr/lib64/python3.4/site-packages/numpy/lib/function_base.py", line 1811, in __call__
return self._vectorize_call(func=func, args=vargs)
File "/usr/lib64/python3.4/site-packages/numpy/lib/function_base.py", line 1880, in _vectorize_call
outputs = ufunc(*inputs)
File "<input>", line 2, in div
ZeroDivisionError: division by zero
有没有一种方法可以调用带有数组参数的函数,并且只在所有参数都被取消屏蔽时才执行该函数?
最佳答案
直接调用该函数是可行的,因为当您调用 div(x,y)
时,div
的参数 a
和 b
成为 MaskedArrays x
和 y
,a/b
的结果代码为 x.__div__(y )
(或 __truediv__
)。
现在,由于 x
是一个 MaskedArray,它可以智能地按照其规则对另一个 MaskedArray 执行除法。
但是,当您对其进行矢量化时,您的 div
函数不会看到任何 MaskedArrays,只会看到标量,在这种情况下是几个 int
。因此,当它在第三项中尝试 a/b
时,它将是“某物”的零,并且您会收到错误。
MaskedArray 的实现似乎是基于专门为 MaskedArrays 重新实现大部分 Numpy。例如,您同时拥有 numpy.log
和 numpy.ma.log
。比较在包含负值的 MaskedArray 上运行它们。两者实际上都返回一个正确的 MaskedArray,但普通的 numpy 版本也会输出一些关于除以零的提示:
In [116]: x = masked_array(data = [-1, 2, 0, 4],
...: mask = [False, False, True, False],
...: fill_value = 999999)
In [117]: numpy.log(x)
/usr/bin/ipython:1: RuntimeWarning: divide by zero encountered in log
#!/usr/bin/python3
/usr/bin/ipython:1: RuntimeWarning: invalid value encountered in log
#!/usr/bin/python3
Out[117]:
masked_array(data = [-- 0.6931471805599453 -- 1.3862943611198906],
mask = [ True False True False],
fill_value = 999999)
In [118]: numpy.ma.log(x)
Out[118]:
masked_array(data = [-- 0.6931471805599453 -- 1.3862943611198906],
mask = [ True False True False],
fill_value = 999999)
如果你在普通列表上运行 numpy.log 版本,它将返回 nan
和 inf
无效值,而不是像 ZeroDivisionError 那样抛出错误
你得到了。
In [138]: a = [1,-1,0]
In [139]: numpy.log(a)
/usr/bin/ipython:1: RuntimeWarning: divide by zero encountered in log
#!/usr/bin/python3
/usr/bin/ipython:1: RuntimeWarning: invalid value encountered in log
#!/usr/bin/python3
Out[139]: array([ 0., nan, -inf])
有了这个,我看到了两种选择:首先,对于您列出的更简单的情况,您可以用空操作替换错误值:div
中的 1(注意数据与你的略有不同,因为有一个零你没有标记为屏蔽):
x = masked_array(data = [1, 2, 0, 4],
mask = [False, False, True, False],
fill_value = 999999)
y = masked_array(data = [4, 0, 0, 4],
mask = [False, True, True, False],
fill_value = 999999)
In [153]: numpy.vectorize(div)(x,y.filled(1))
Out[153]:
masked_array(data = [0.25 2.0 -- 1.0],
mask = [False False True False],
fill_value = 999999)
该方法的问题是填充的值在结果中被列为未屏蔽,这可能不是您想要的。
现在,div
可能只是一个示例,您可能想要没有“无操作”参数的更复杂的行为。在这种情况下,您可以像 Numpy 对 log
所做的那样,避免抛出异常,而是返回一个特定的值。在这种情况下,numpy.ma.masked
。 div
的实现变成了这样:
In [154]: def div(a,b):
...: try:
...: return a/b
...: except Exception as e:
...: warnings.warn (str(e))
...: return numpy.ma.masked
...:
...:
In [155]: numpy.vectorize(div)(x,y)
/usr/bin/ipython:5: UserWarning: division by zero
start_ipython()
/usr/lib/python3.6/site-packages/numpy/lib/function_base.py:2813: UserWarning: Warning: converting a masked element to nan.
res = array(outputs, copy=False, subok=True, dtype=otypes[0])
Out[155]:
masked_array(data = [0.25 -- -- 1.0],
mask = [False True True False],
fill_value = 999999)
但也许你已经有了这个功能不想改变它,或者它是第三方的。在这种情况下,您可以使用高阶函数:
In [164]: >>> def div(a,b):
...: return a/b
...:
In [165]: def masked_instead_of_error (f):
...: def wrapper (*args, **kwargs):
...: try:
...: return f(*args, **kwargs)
...: except:
...: return numpy.ma.masked
...: return wrapper
...:
In [166]: numpy.vectorize(masked_instead_of_error(div))(x,y)
/usr/lib/python3.6/site-packages/numpy/lib/function_base.py:2813: UserWarning: Warning: converting a masked element to nan.
res = array(outputs, copy=False, subok=True, dtype=otypes[0])
Out[166]:
masked_array(data = [0.25 -- -- 1.0],
mask = [False True True False],
fill_value = 999999)
在上面的实现中,使用警告可能是也可能不是一个好主意。您可能还想限制为返回 numpy.ma.masked
而捕获的异常类型。
另请注意,masked_instead_of_error
已准备好用作函数的装饰器,因此您无需每次都使用它。
关于python - 对屏蔽数组的有效值调用函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45361146/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!