gpt4 book ai didi

python - np.where() 没有返回 numpy python 中的预期索引

转载 作者:太空宇宙 更新时间:2023-11-03 10:58:39 25 4
gpt4 key购买 nike

我有这个风数据集,其中包含以 m/s 为单位的风速,我想计算时间序列中非零数据的周期。

  • 每个非零数据周期都算作一个“天气事件”。

  • 我还想知道这些事件在数据集中的位置(即索引)。

一种方法是统计系列中每组非零数据之前的第一个0,以确定事件的数量,然后将每个索引值加一,得到事件的位置。

# create mock data. 
d=np.zeros([209])
d1=np.random.randn(189)
d2=np.zeros(9)
d3=np.random.randn(281)
d4=np.zeros(27)
d5=np.random.randn(21)
d6=np.zeros(155)
d7=np.random.randn(58)
mock_data=np.concatenate((d,d1,d2,d3,d4,d5,d6,d7),axis=0)


indices=np.squeeze(np.array(np.where(mock_data!=0))) # Returns the position vector of every non-zero in the record.

# create a vector to store the positions of the previous zero before each SAW event.
dummy=np.zeros(0)
for i in range(len(indices)):
dummy=np.append(dummy,indices[i]-1)
dummy=dummy.astype(int)
dummy=np.int64(dummy)

zerovalue=np.squeeze(np.array(np.where(mock_data[dummy]==0))) # Should return the position of the previous zero before each SAW event.

# Add 1 to each value in zerovalue
new_index=np.zeros(0)
for i in range(len(zerovalue)):
new_index=np.append(date_index,zerovalue[i]+1)

但是,我遇到了 np.where() 没有返回我期望的索引的问题。它不是返回指示非零数据组的第一个值所在位置的索引,而是返回看似随机的索引。

例如,第一个索引应该是 209,但我得到的是 0。非常感谢任何帮助。

最佳答案

让我们从清理代码开始:

  1. 您不需要挤压和数组转换;只需从 where 结果中提取第一个元素:

    indices = np.where(mock_data)[0]
    # array([209, 210, 211, 212, 213, ... 945, 946, 947, 948])
  2. NumPy 可以进行矢量化计算,因此您不需要循环来创建 dummy:

    dummy = indices - 1
  3. 对于zero_value,你也可以省略squeeze和array cast;但这次你想要零元素,所以比较必须保留:

    zerovalue = np.where(mock_data[dummy] == 0)[0]
    # array([ 0, 189, 470, 491])
  4. NumPy 再次向量化您的计算:

    new_index = zerovalue + 1

那么现在开始解释,也许你会发现哪里出了问题:

  • indices 是您测量风的点。
  • dummy 是您再次测量风的前一天(没有风的最后一天)
  • zerovalue 是测量风的累积天数(您检查在没有可测量风后开始测量风的指数)。因为你随风而止,所以你最终会忽略随风而去的最后日子。

如果你想在至少一天没有风之后找到第一天有风,你需要保持你的数组结构:

mock_data != 0 # boolean array where you measured wind
np.diff(mock_data != 0) # boolean array which has True between no-wind and wind.
np.where(np.diff(mock_data != 0))[0] # array with indexes where it changed
# array([208, 397, 406, 687, 714, 735, 890], dtype=int64)

这不是最终结果,因为你还有从有风天到无风天的变化,所以你丢弃了每一秒的元素

np.where(np.diff(mock_data != 0))[0][0::2]
# array([208, 406, 714, 890], dtype=int64)

所以你所有的计算都可以在一行中完成:

np.where(np.diff(mock_data != 0))[0][0::2] + 1 # with the +1
# array([209, 407, 715, 891], dtype=int64)

如果您对风天结束的地方感兴趣,只需使用 [1::2] 将其切片:

np.where(np.diff(mock_data != 0))[0][1::2] + 1
# array([398, 688, 736], dtype=int64)

关于python - np.where() 没有返回 numpy python 中的预期索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36928046/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com