gpt4 book ai didi

java - 为 Weka 生成 Arff 文件

转载 作者:行者123 更新时间:2023-11-30 08:15:38 28 4
gpt4 key购买 nike

嘿,我是这项工作的新手,在搜索如何完成它后我感到很困惑!实际上我想为 weka 创建一个稀疏的 ARFF 文件用于文本分类!我一直在网上搜索如何开始使用它。我的要求是生成一个应该与 weka 兼容的稀疏 arff 文件!arff 的大纲应该是这样的:

 @relation myrelation
@attribute att0 numeric
@attribute att1 numeric
@data
{0,1,4,5 , A}
{0,5,2,,1 B}

这样我有一些字符串,然后是一个类假设我的数据集如下:

 string is a string A
Hello a string B
Another is string C
.
.
.

首先是字符串,然后是类 A、B 或 C...所以我想要的是将我的数据集转换成上面提到的稀疏 arff 格式。有人可以给我一个方向,我该怎么做?请我想用 java 来做

最佳答案

您可以使用 Weka 的 StringToWordVector 过滤器将文本转换为词 vector (但不一定是稀疏矩阵)。看看我的tutorial对此。

关于java - 为 Weka 生成 Arff 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28769427/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com