gpt4 book ai didi

Python cosine_similarity 不适用于具有 NaN 的矩阵

转载 作者:行者123 更新时间:2023-12-01 01:17:00 33 4
gpt4 key购买 nike

需要找到像这样R函数一样工作的python函数:

proxy::simil(method = "cosine", by_rows = FALSE) 

即通过成对计算数据帧行之间的余弦距离来找到相似度矩阵。如果存在 NaN,它应该删除这两行中包含 NaN 的精确列

Simil function description (R)

Python error because of NaNs

更新。我还尝试使用 scipy.spatial.distance 中的 cosine 函数删除循环中每对行中的 NaN 。它给出的结果与 R 中的结果相同,但可以工作很长时间:(

最佳答案

您可以尝试这种方法:https://github.com/Midnighter/nadist ,或者,您可以将 _chk_weightsnan_screen=True 结合使用,如metaperture 此处所述 https://github.com/scipy/scipy/issues/3870 ,希望有帮助。

我发现 Midnighter 之前在 stackoverflow 上发布过同样的问题:Compute the pairwise distance in scipy with missing values 。还有一些其他的解决方案,但是,当他继续将其细胞化时,我敢打赌它们不是最好的。

关于Python cosine_similarity 不适用于具有 NaN 的矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54236133/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com