gpt4 book ai didi

r - 在大型 data.table 上使用 grepl 的内存和性能

转载 作者:行者123 更新时间:2023-12-04 13:46:52 26 4
gpt4 key购买 nike

<分区>

我在 R 中对大型数据集执行一个简单的命令,结果很慢并且使用了太多内存。这是一个使用两行的示例,尽管我的真实数据集有 1.54 亿行:

library(data.table)
Dt<-data.table(title1=c("The coolest song ever",
"The greatest music in the world"),
title2=c("coolest song","greatest music"))

Dt$Match<-sapply(seq_len(nrow(Dt)), function(x) grepl(Dt$title2[x],Dt$title1[x]))

Dt$Match 的结果应该是TRUE,TRUE。在运行这个脚本之前,我还剩下大约 12 Gb 的 RAM,但是随着这段缓慢的代码运行,内存已经用完了。

是否有更有效的方法来获得相同的结果?也许利用数据表包?

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com