gpt4 book ai didi

r - 如何使用 sparklyr 计算字符串之间的距离?

转载 作者:行者123 更新时间:2023-12-04 10:33:29 25 4
gpt4 key购买 nike

我需要使用 sparklyr 计算 R 中两个字符串之间的距离。有没有办法使用 stringdist 或任何其他包?我想使用cousine distance。此距离用作 stringdist 函数的方法。

提前致谢。

最佳答案

您可以使用内置 levenshtein功能:

df <- copy_to(sc, data.frame(a=c("This is it", "Foo"), b=c("This is", "foobar)))

# df %>% mutate(dist = levenshtein(a, b))
# # Source: lazy query [?? x 3]
# # Database: spark_connection
# a b dist
# <chr> <chr> <int>
# 1 This is it This is 3
# 2 Foo foobar 4

关于r - 如何使用 sparklyr 计算字符串之间的距离?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49077170/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com