python - interpolate.griddata 只使用一个核心-6ren

python - interpolate.griddata 只使用一个核心

转载作者：太空宇宙更新时间：2023-11-04 04:33:37

31

4

我正在插入一个 2d numpy 数组来填充用 NaN 标记的缺失值。以下代码有效但仅使用一个内核。有没有更好的函数可以用来利用我拥有的所有 24 个内核？

x = np.arange(0, array.shape[1])
y = np.arange(0, array.shape[0])
#mask invalid values
array = np.ma.masked_invalid(array)
xx, yy = np.meshgrid(x, y)
#get only the valid values
x1 = xx[~array.mask]
y1 = yy[~array.mask]
newarr = array[~array.mask]

GD1 = interpolate.griddata((x1, y1), newarr.ravel(),
                      (xx, yy),
                         method='cubic')

最佳答案

我认为你可以用 dask 做到这一点.我不太熟悉 dask 但这是一个开始:

import numpy as np
from scipy import interpolate
import dask.array as da
import matplotlib.pyplot as plt
from dask import delayed

# create data with random missing entries
ar_size = 2000
chunk_size = 500
z_array = np.ones((ar_size, ar_size))
z_array[np.random.randint(0, ar_size-1, 50),
      np.random.randint(0, ar_size-1, 50)]= np.nan

# XY coords
x = np.linspace(0, 3, z_array.shape[1])
y = np.linspace(0, 3, z_array.shape[0])

# gen sin wave for testing
z_array = z_array * np.sin(x)
# prove there are nans in the dataset
assert np.isnan(np.sum(z_array))

xx, yy = np.meshgrid(x, y)
print("global x.size: ", xx.size)

# make dask arrays
dask_xyz = da.from_array((xx, yy, z_array), chunks=(3, chunk_size, "auto"), name="dask_all")
dask_xx = dask_xyz[0,:,:]
dask_yy = dask_xyz[1,:,:]
dask_zz = dask_xyz[2,:,:]

# select only valid values
dask_valid_y1 = dask_yy[~da.isnan(dask_zz)]
dask_valid_x1 = dask_xx[~da.isnan(dask_zz)]
dask_newarr = dask_zz[~da.isnan(dask_zz)]

def gd_wrapped(x1, y1, newarr, xx, yy):
    # note: linear and cubic griddata impl do not extrapolate
    # and therefore fail near the boundaries... see RBF interp instead
    print("local x.size: ", x1.size)
    gd_zz = interpolate.griddata((x1, y1), newarr.ravel(),
                               (xx, yy),
                               method='nearest')
    return gd_zz

def rbf_wrapped(x1, y1, newarr, xx, yy):
    rbf_interpolant = interpolate.Rbf(x1, y1, newarr, function='linear')
    return rbf_interpolant(xx, yy)

# interpolate
# gd_chunked = [delayed(rbf_wrapped)(x1, y1, newarr, xx, yy) for \
gd_chunked = [delayed(gd_wrapped)(x1, y1, newarr, xx, yy) for \
            x1, y1, newarr, xx, yy \
            in \
            zip(dask_valid_x1.to_delayed().flatten(),
                dask_valid_y1.to_delayed().flatten(),
                dask_newarr.to_delayed().flatten(),
                dask_xx.to_delayed().flatten(),
                dask_yy.to_delayed().flatten())]
gd_out = delayed(da.concatenate)(gd_chunked, axis=0)
gd_out.visualize("dask_par.png")
gd1 = np.array(gd_out.compute())
print(gd1)
assert gd1.shape == (ar_size, ar_size)
print(gd1.shape)
plt.figure()
plt.imshow(gd1)
plt.savefig("dask_par_sin.png")

# prove we have no more nans in the data
assert ~np.isnan(np.sum(gd1))

此实现存在一些问题。 Griddata 无法推断，因此 nans 是 block 边界的问题。你可能可以用一些重叠的单元格来解决这个问题。作为权宜之计，您可以使用 method='nearest' 或尝试 radial basis function interpolation .

关于python - interpolate.griddata 只使用一个核心，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52227599/

31

4

0

文章推荐： python - 快速读取所有 csv 文件并更新共享字典

文章推荐： c - Windows 计时器是否与 Sleep() 一样准确？

文章推荐： c - 一种新的换行方法。它是编译器特定的功能还是新的语言标准？

文章推荐： python - Twine 在不提示输入密码的情况下挂起

javascript - AngularJS 错误 : $interpolate:interr Interpolation Error
我正在尝试使用 AngularJS 将 YouTube 视频插入到我的网站中，但我一直收到相同的错误: Error: $interpolate:interr Interpolation Error 为
javascript - AngularJS错误: $interpolate:interr Interpolation Error with $routeParams
我正在尝试将动态链接从 json 加载到我的 iframe 模板中。当我加载 iframe 页面时，会弹出此错误。我真的不知道为什么。这是我第一次看到这个错误。下面是代码。 Controller ap
python - Iterated Interpolation : First interpolate grids, 然后插值
我想从 x 进行插值到 z .但有一个警告: 取决于状态y , 我有一个不同的 xGrid - 我需要对其进行插值。我有一个 y 的网格, yGrid .说 yGrid=[0,1] .和 xGrid
javascript - d3 : how to interpolate a string (with numbers in it) so that the numbers don't get interpolated
我是 javascript 的新手，但几周前刚刚钻研 d3.js 尝试创建时空可视化。我想要实现的是基于以下代码的类似 ( https://jsfiddle.net/dmatekenya/mz5fx
python - scipy.interpolate.splrep 和 scipy.interpolate.UnivariateSpline 之间的用例有什么区别？
scipy.interpolate.splrep(x, y, w=None, xb=None, xe=None, k=3, task=0, s=None, t=None, full_output=0,
python - scipy.interpolate.griddata 和 scipy.interpolate.Rbf 之间的区别
Scipy 函数 griddata和 Rbf两者都可以用于对随机分散的 n 维数据进行插值。它们之间有什么区别？其中之一在准确性或性能方面更胜一筹吗？ IMO，这不是 this question 的重
python - 具有 scipy.interpolate : Poor interpolation for low-amplitude, 快速振荡函数的样条表示
我需要(以数字方式)计算函数的一阶和二阶导数，为此我尝试同时使用 splrep 和 UnivariateSpline 来创建样条曲线插值函数的导数。但是，对于幅度为 10^-1 或更低的函数，样条表
interpolation - 整数的余弦插值
好的，所以我最近一直在研究插值。遗憾的是，我读过的几乎每篇文章都只讨论精确到 0.0 到 1.0 的小数级别的插值。我想插入整数整数，不管它们有多大，或者是否有负数或其他什么。我用线性插值完成了这个:
interpolation - 二维插值不规则网格fortran
如何在 FORTRAN 中实现二维插值，其中数据如下所示。 x 和 y 是两个坐标，z 是依赖于它们的值 x 间隔均匀但 y 不均匀间隔且 y 的最大值对应于 x 的统一值不断增加。在不损失太多准
interpolation - 哪种多元插值方法最适合实际使用？
在彼得阿尔弗雷德的 article关于多元散点数据插值，他提到，从各种方案中，只有少数方案真正受到从业者的欢迎。例如，他命名为 Shepard 方法和 Hardy Multiquadrics。但那篇文
interpolation - 重采样还是插值？
我不清楚图像处理中重采样和插值之间的区别。如果我有一个 geotiff 并且我想提高它的分辨率，我应该使用重采样方法，例如最近邻，对吗？例如，我发现 gdalwarp 函数可以做到这一点。插值方法，
interpolation - 如何在两组不规则数据之间插值？
对于这个有点令人困惑的标题，我感到很抱歉，但我不确定如何更清楚地总结这一点。我有两组 X,Y 数据，每组对应一个总体值。它们是从原始数据中相当密集地采样的。我正在寻找一种方法，为任何给定的 Y 找到
interpolation - 如何在两组不规则数据之间插值？
我很抱歉标题有点困惑，但我不确定如何更清楚地总结这一点。我有两组X,Y数据，每组对应一个大概的整体值。它们是从原始数据中相当密集地采样的。我正在寻找的是一种方法，可以为我已有的集合之间的值找到任何给
javascript - "Interpolate"不是一个函数
我是 D3 新手，正在尝试一些图表。在使用 D3 V4 构建折线图时，我遇到了以下错误。 d3.line(...).x(...).y(...).interpolate is not a functio
Java 表达式语言 : Interpolation?
问候，在我正在开发的网络应用程序中，我想做如下事情: 我有一个 bean class Gene{ String geneid; String sequence; .. } // EL express
javascript - $interpolate 一个数组而不是一个对象
有什么方法可以将 Angular 的 $interpolate 与数组而不是对象一起使用？示例代码: var exp = $interpolate('Hello {{name}}!'); var r
python - 我想在给定的虚拟函数中更新我的函数 interpolate()
我是编程新手，我会尝试编写一个线性插值函数: from bisect import bisect_left def interpolate((x_list, y_list), x_test):
Android场景转场: Custom interpolator?
我启动了一个带有共享元素的场景转换的 Activity，它工作正常。 ActivityOptionsCompat options = ActivityOptionsCompat.makeSceneTr
详解VUE中的插值( Interpolation)语法
背景分析在传统的html页面中我们可以定义变量吗？当然不可以，那我们假如希望通过变量的方式实现页面内容的数据操作也是不可以的。当然我们可以在服务端通过定义html标签库方式，然后以html作为模
interpolation - 双三次插值中的 "t"是什么？
我在 wikipedia 上阅读了关于双三次插值的信息.我遇到了变量 t这是没有定义的。等式是: 谁能告诉我这个变量是什么意思以及它的常用值是什么？最佳答案 t 是 0 到 1 之间的任何数字。

首页

博学

6Ren·AI

商城

python - interpolate.griddata 只使用一个核心