gpt4 book ai didi

r - 您将如何使用 R arules 包中的 read.transactions 处理此问题?

转载 作者:行者123 更新时间:2023-12-04 05:49:31 24 4
gpt4 key购买 nike

我正在尝试使用函数 read.transactions 读取 .txt 文件.这是我的文件结构:

1121,1141,1212,1311,1343,2111,2171,2213,2215,2311,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1111,1112,1126,1145,1146,1181,1213,1441,2122,2322,3311,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1172,2131,2173,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
1141,1223,1416,2322,2323,112701,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,

我正在使用这行代码来执行此操作:
tr <- read.transactions("disco.txt", format = "basket", sep=',',rm.duplicates= TRUE)

但我得到的是这样的( inspect(head(tr)) ):
1 {,      
1121,
1141,
1212,
1311,
1343,
2111,
2171,
2213,
2215,
2311}
2 {,
1111,
1112,
1126,
1145,
1146,
1181,
1213,
1441,
2122,
2322,
3311}
.
.
.

我的问题是:如何从这些交易中删除“空”项集?这个想法是稍后应用先验算法以获得有吸引力的规则。你知道那个算法 aprioriR可以处理这个问题吗?我已经将 apriori 算法应用于我刚刚向您展示的事务,但其中许多在包含空项集方面是无用的。

提前谢谢了!
问候!

最佳答案

我认为尾随逗号是这里的问题。这就是为什么我认为最简单的方法是在末尾修剪“,”并使用 read.transactions() 读入新的/修改后的文件。

它不是特别优雅,但它可以完成工作:

library("arules")

temp <- readLines("stack.dat")
for (i in 1:length(temp))
temp[i] <- gsub(",*$", "", temp[i])
writeLines(temp, "stack_mod.dat")

tr <- read.transactions("stack_mod.dat", format = "basket", sep=',', rm.duplicates=TRUE)

你觉得可以吗?

关于r - 您将如何使用 R arules 包中的 read.transactions 处理此问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10248816/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com