gpt4 book ai didi

RecordLinkage 包和 RLBigDataLinkage 类对象

转载 作者:行者123 更新时间:2023-12-02 04:57:59 32 4
gpt4 key购买 nike

我正在尝试使用 R 包 RecordLinkage,并且正在使用 two articles包作者作为使用指南,除了包 documentation .

我正在使用 2 个大型数据集(超过 100k 行),我希望将它们链接起来,因此我正在使用围绕 S4 类 RLBigDataLinkage 构建的包的那些元素。

我首先在 R 中运行以下行:

>library('RecordLinkage')
>data1 <- as.data.frame(#source)
>data2 <- as.data.frame(#source)
>rpairs <- RLBigDataLinkage(data1, data2, strcmp = 2:8, exclude = 9:10)

这工作正常(尽管需要一些时间),并写入必要的 .ff 文件来处理大型数据集。

如果我再尝试:

>rpairs <- epiWeights(rpairs)

或者:

>rpairs <- epiWeights(rpairs, e = 0.01, f = getFrequencies(rpairs))

然后当我运行时:

>summary(rpairs)

我收到错误信息:

Error in dbGetQuery(object@con, "select count(*) from data1") : 
error in evaluating the argument 'conn' in selecting a method for function 'dbGetQuery': Error: no slot of name "con" for this object of class "RLBigDataLinkage"

另一方面,如果我运行:

>result <- epiClassify(rpairs, 0.5)
>getTable(result)

我收到错误信息:

Error in table.ff(object@data@pairs$is_match, object@prediction, useNA = "ifany") : 
Only vmodes integer currently allowed - are you sure ... contains only factors or integers?

我显然遗漏了一些关于如何处理这些对象的信息。有没有人有任何看到我的错误的包的经验?非常感谢。

最佳答案

当'rpairs'的类型是'RLBigDataLinkage'时使用print(rpairs),你会得到rpairs的摘要。

关于RecordLinkage 包和 RLBigDataLinkage 类对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19693638/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com