gpt4 book ai didi

R - 将数据帧转换为格式为 featureName :featureValue 的数据集

转载 作者:行者123 更新时间:2023-12-03 21:20:24 25 4
gpt4 key购买 nike

这个问题在这里已经有了答案:





read/write data in libsvm format

(7 个回答)


7年前关闭。




原来我想要的格式叫做 “SVM-Light” 并在此处描述 http://svmlight.joachims.org/ .

我有一个数据框,我想将其转换为格式如下的文本文件:

output featureIndex:featureValue ... featureIndex:featureValue 

例如:
t = structure(list(feature1 = c(3.28, 6.88), feature2 = c(0.61, 1.83
), output = c("1", "-1")), .Names = c("feature1", "feature2",
"output"), row.names = c(NA, -2L), class = "data.frame")

t
# feature1 feature2 output
# 1 3.28 0.61 1
# 2 6.88 1.83 -1

会成为:
1 feature1:3.28 feature2:0.61
-1 feature1:6.88 feature2:1.83

到目前为止我的代码:
nvars = 2
l = array("row", nrow(t))
for(i in(1:nrow(t)))
{
l = t$output[i]

for(n in (1:nvars))
{
thisFeatureString = paste(names(t)[n], t[[names(t)[n]]][i], sep=":")
l[i] = paste(l[i], thisFeatureString)
}
}

但我不确定如何完成并将结果写入文本文件。
此外,代码可能效率不高。

是否有一个库函数可以做到这一点?因为这种输出格式对于 Vowpal Wabbit 来说似乎很常见。

最佳答案

我找不到现成的解决方案,尽管 svm-light 数据格式似乎被广泛使用。

这是一个有效的解决方案(至少在我的情况下):

############### CONVERT DATA TO SVM-LIGHT FORMAT ##################################
# data_frame MUST have a column 'target'
# target values are assumed to be -1 or 1
# all other columns are treated as features
###################################################################################
ConvertDataFrameTo_SVM_LIGHT_Format <- function(data_frame)
{
l = array("row", nrow(data_frame)) # l for "lines"
for(i in(1:nrow(data_frame)))
{
# we start each line with the target value
l[i] = data_frame$target[i]

# then append to the line each feature index (which is n) and its
# feature value (data_frame[[names(data_frame)[n]]][i])
for(n in (1:nvars))
{
thisFeatureString = paste(n, data_frame[[names(data_frame)[n]]][i], sep=":")
l[i] = paste(l[i], thisFeatureString)
}
}

return (l)
}
###################################################################################

关于R - 将数据帧转换为格式为 featureName :featureValue 的数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24142467/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com