gpt4 book ai didi

python - 使用 numpy 的相似性度量

转载 作者:行者123 更新时间:2023-12-04 09:36:42 38 4
gpt4 key购买 nike

我试图定义我自己的相似度度量,其灵感来自 jaccard 相似度分数。我在 jaccard 指标中唯一想要的额外东西是是否也考虑了标签的频率。为此,我编写了以下代码片段:

u = [12,0,3]
v = [24,6,1]
num = 0
den = 0
for i in range(3):
if u[i]!=0 and v[i] != 0:
num+=(u[i]+v[i])
den+=(u[i]+v[i])
print(1 - num/den)
所以我的问题是
  • 这可以通过 numpy 的按位运算符完成吗?
  • 我可以使用任何其他相似性指标吗?我试过余弦相似度。哪个会更有帮助?
  • 最佳答案

    一种使用 numpy 向量化函数的方法:

    arr = np.array([u,v])

    s = arr.sum(0)
    (s*(arr==0).any(0)).sum()/s.sum()
    输出:
    0.13043478260869565

    关于python - 使用 numpy 的相似性度量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62543973/

    38 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com