gpt4 book ai didi

r - 使用 e1071 (SVM) 进行文本分类

转载 作者:行者123 更新时间:2023-12-04 09:35:06 24 4
gpt4 key购买 nike

我有一个包含两列的数据框。一列包含文本。该列的每一行包含三个不同类别(技能、资格、经验)的某种类型的数据,另一列是它们各自的类别标签。

数据帧快照:

snapshot of the dataframe

如何从包 e1071 应用 svm。如何将文本数据列转换为分数。我想将文本列转换为文档术语矩阵。他们还有别的办法吗?如何制作d-t-矩阵?

最佳答案

您可以使用 RTextTools包以创建文档术语矩阵。
使用 create_matrix 函数:

# Create the document term matrix. If column name is v1
dtMatrix <- create_matrix(data["v1"])
然后你可以使用这个训练你的 SVM 模型:
# Configure the training data
container <- create_container(dtMatrix, data$label, trainSize=1:102, virgin=FALSE)

# train a SVM Model
model <- train_model(container, "SVM", kernel="linear", cost=1)
如需信息, RTextTools 用户 e1071 在内部打包以训练模型。
有关更多详细信息,请参阅 RTextTools 和 e1071 文档。

关于r - 使用 e1071 (SVM) 进行文本分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40051542/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com