gpt4 book ai didi

r - 使用 RTextTools 时如何保存 ID 字段

转载 作者:行者123 更新时间:2023-11-30 09:24:15 24 4
gpt4 key购买 nike

我正在使用 RTextTools 来训练和分类来自 MySQL 表的数据。我有一个名为 id 的字段,用于标识数据库中的每个文档。但是,使用以下代码后,id 字段不再存在。

matrix <- create_matrix(cbind(data$text,data$id),
language="english", removeNumbers=TRUE,
removeSparseTerms=.998)

corpus <- create_corpus(matrix,
as.numeric(data$valid),
trainSize=1:750, testSize=751:1000,
virgin=FALSE)

SVM <- train_model(corpus,"SVM")

SVM_CLASSIFY <- classify_model(corpus, SVM)

如上所述,data$id 似乎在此过程中丢失了。知道如何保持 ID 与数据的关联吗?

最佳答案

您可以使用cbind 命令将 ID 列添加回输出。例如:

output <- cbind(data$id,SVM_CLASSIFY)

关于r - 使用 RTextTools 时如何保存 ID 字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11067156/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com