gpt4 book ai didi

r - SparkR中使用grep出错

转载 作者:行者123 更新时间:2023-12-02 03:18:11 24 4
gpt4 key购买 nike

我在对 Spark DataFrame 进行子集化时遇到问题。

我有一个名为 nfeDataFrame,其中包含一个名为 ITEM_PRODUTO 的列,该列的格式为字符串。我想根据项目列是否包含单词“AREIA”来对此 DataFrame 进行子集化。我可以轻松地根据确切的短语对数据进行子集化:

nfe.subset1 <- subset(nfe, nfe$ITEM_PRODUTO == "AREIA LAVADA FINA")

nfe.subset2 <- subset(nfe, nfe$ITEM_PRODUTO %in% "AREIA")

但是,我想要的是 ITEM_PRODUTO 列中包含单词“AREIA”的所有行的子集。但是,当我尝试使用 grep 时,我收到一条错误消息:

nfe.subset3 <- subset(nfe, grep("AREIA", nfe$ITEM_PRODUTO))

# Error in as.character.default(x) :
# no method for coercing this S4 class to a vector

我尝试了多次语法迭代,也尝试了 grepl,但似乎没有任何效果。这可能是一个语法错误,但有人可以帮助我吗?

谢谢!

最佳答案

标准 R 函数无法应用于 SparkDataFrame。使用类似`:

where(nfe, like(nfe$ITEM_PRODUTO, "%AREIA%"))

类似:

where(nfe, rlike(nfe$ITEM_PRODUTO, ".*AREIA.*"))

关于r - SparkR中使用grep出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48025720/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com