gpt4 book ai didi

python - Scipy 的 pdist 相关指标与 numpy corrcoef 不同

转载 作者:太空宇宙 更新时间:2023-11-04 10:29:31 25 4
gpt4 key购买 nike

我使用 scipy 的 pdist 和相关度量来构建相关矩阵,但这些值与我从 numpy 的 corrcoef 获得的值不匹配。

我将 pdist 应用于一个非常简单的两个具有相同值的一维数组:[1,2,3] 和 [1,2,3]:

from scipy.spatial.distance import pdist, squareform
import pandas as pd
import numpy as np

df = pd.DataFrame([[1,1],[2,2],[3,3]]).transpose()
print np.corrcoef(df)
print squareform(pdist(df, metric='correlation'))

我没有输出相关值 1,而是从 pdist 得到了 2.2E-16:

[[ 1.  1.]
[ 1. 1.]]

[[ 0.00000000e+00 2.22044605e-16]
[ 2.22044605e-16 0.00000000e+00]]

以下是我在 scipy 中为它们的相关性指标找到的代码:

umu = u.mean()
vmu = v.mean()
um = u - umu
vm = v - vmu
dist = 1.0 - np.dot(um, vm) / (norm(um) * norm(vm))

最佳答案

“相关距离”与相关系数不同。两个相等点之间的“距离”应该为 0。(如果您搜索“相关距离”,请注意还有另一个概念,即“距离相关”,这与作为“相关距离”。)

关于python - Scipy 的 pdist 相关指标与 numpy corrcoef 不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27660445/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com