gpt4 book ai didi

r - 从字符串距离矩阵中提取最佳匹配

转载 作者:行者123 更新时间:2023-12-02 05:07:49 25 4
gpt4 key购买 nike

我无法从字符串距离矩阵中提取最佳匹配。

我正在使用包 stringdist 来计算字符串距离矩阵。

例如,我正在使用这些代码行生成矩阵。

library(stringdist)
lookup <- c('Dog', 'Cat', 'Bear')
data <- c('Do g', 'Do gg', 'Caat')
d.matrix <- stringdistmatrix(a = lookup, b = data, useNames="strings",method="cosine")

矩阵看起来像这样

enter image description here

我的方法是提取余弦相似度,其中最小的数字是最佳匹配。

例如,“Do g”将与“Dog”匹配

我想要生成的是具有余弦相似度值的匹配对数据框

data  |  matchwith  |  cosine.s

Do g Dog 0.1338746
Do gg Dog 0.1271284
Caat Cat 0.05719096

我不知道如何将数据转换为我想要的表格格式(上面)。

任何帮助将不胜感激。

最佳答案

which.min 函数很好地解决了这个问题。
这是使用基本 R 的解决方案:

library(stringdist)
lookup <- c('Dog', 'Cat', 'Bear')
data <- c('Do g', 'Do gg', 'Caat')
d.matrix <- stringdistmatrix(a = lookup, b = data, useNames="strings",method="cosine")

#list of minimun cosine.s
cosines<-apply(d.matrix, 2, min)

#return list of the row number of the minimum value
minlist<-apply(d.matrix, 2, which.min)
#return list of matching values
matchwith<-lookup[minlist]

#final answer
answer<-data.frame(data, matchwith, cosines)

关于r - 从字符串距离矩阵中提取最佳匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50520702/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com