machine-learning - 如何在weka中使用svm(smo)的字符串数据-6ren

machine-learning - 如何在weka中使用svm(smo)的字符串数据

转载作者：行者123 更新时间：2023-11-30 09:20:32

24

4

我有一个 arff 文件，其中包含一些句子(波斯语)以及每个句子前面的一个单词，该单词在 @data 部分中显示其类别。我需要使用 smo 进行分类。问题:

1)是否需要将句子改为向量？

2) 我选择了“字符串到词向量”，但 smo 处于非事件状态并且仍然无法工作。 (当然还有其他算法，例如朴素贝叶斯)。

如何将这些文本数据与 smo 一起使用？

enter image description here

上图是一个非常小的示例文件。

文件样本: https://www.dropbox.com/s/ohpyortve8jbwhe/shoor.arff?dl=0

最佳答案

首先，您需要应用“字符串到词向量”过滤器。之后，在分类选项卡上，您需要将目标类别更改为“(Nom)类别”。这足以启用朴素贝叶斯和 SVM 算法。我下载了数据集，效果很好。

您可以按照本教程进行操作: https://www.youtube.com/watch?v=zlVJ2_N_Olo

希望对您有帮助

from sklearn.feature_extraction.text import TfidfVectorizer
import arff
from sklearn import svm
import numpy as np
from sklearn.model_selection import train_test_split

data=list(arff.load('shoor.arff'))

text=[]
label=[]
for r in data:
    if (len(r)>1):
        text.append(r[0])
        label.append(r[1])
tfidf = TfidfVectorizer().fit_transform(text)
features = (tfidf * tfidf.T).A


X_train, X_test, y_train, y_test = train_test_split(features, label, test_size=0.5, random_state=0)
clf = svm.SVC(kernel='linear', C=1).fit(X_train, y_train)
clf.score(X_test, y_test)

1.0

关于machine-learning - 如何在weka中使用svm(smo)的字符串数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41305529/

24

4

0

文章推荐： machine-learning - 监督文本评分

文章推荐： matlab - 什么样的LDA执行 'fitcdiscr'功能？

文章推荐： java - 使用枚举作为参数

sql-server-2008 - 无法将类型 "Microsoft.SqlServer.Management.Smo.Server"的值转换为类型 "Microsoft.SqlServer.Management.Smo.Server"
我正在尝试使用 SMO 通过 Powershell 恢复数据库，但是当我尝试定义和使用服务器对象时，出现以下错误: Cannot convert argument "srv", with value:
SMO:恢复到不同的数据库
我已经阅读了十几个不同的博客，并通读了 msdn 示例，但它们对我不起作用。最终我想做的是自动将数据库从我们的生产实例移动到我们的开发实例，或其他方向。我采取的方法是: 备份/恢复到临时数据库分
c# - SMO 恢复花了很长时间
我使用这个 SMO 来恢复备份: Server myServer = new Server(@"PC-1\Instance1"); Restore restoreDB
C# SMO-检查表是否已存在于目标服务器
我已经编写了一个 C# 代码来使用 SMO 在两个远程服务器之间传输表，我想知道的是无论如何都可以检查目标服务器中是否已经存在具有确切模式、列名、数据类型的表，约束和一切。这样我就不必每次都删除现有表
C# SMO 创建外部表
我正在考虑使用 C# SMO 库以编程方式创建当前数据库结构(不含数据)的副本。我已经成功地移动了模式、表、存储过程和外部资源，但是我很难这样做。我正在考虑使用这样提供的表对象: TableColle
C# SMO 没有脚本约束
我在 C# 中使用 SMO 从数据库生成整个模式的脚本。这是我使用的代码: // Instanciando Server srv = new Server(con); // Refere
C# smo 项目程序集未引用错误
我正在做一个使用 smo 对象(服务器、数据库)的 C# 项目。我包括了 using Microsoft.SqlServer.Management.Smo; using Microsoft.SqlS
C# SMO 数据库不记录创建
我有一个集成测试，它创建了一个 Microsoft.SqlServer.Management.Smo.Database 类型的数据库: var defaultConnectionConnectionS
c# - smo 恢复数据库
我使用 SQL Server SMO 将 .bak 恢复到新数据库，但没有成功。 sql server是2012，smo object版本来自最新的sdk version 11.0 文件 .bak 是
c# - SMO 中的连接超时
我正在向数据库中插入大量行并尝试在其上建立主键。如果我创建表并立即建立一个键，即使使用 SQLBulkCopy 命令，插入数据也需要 10 倍的时间。所以这不是一个可行的选择。我现在要做的是插入数据，
WEKA SMO 与 LIBSVM
WEKA 的 SMO 与 LIBSVM 不同吗？我问是因为它在 LIBSVM 的 site 上说那:it implements an SMO-type algorithm proposed in t
.net - 在大型数据库上使用 smo 备份失败
我使用 vb.net 备份 sql '05 - '08 数据库。它在较小的数据库上效果很好。但当涉及大型数据库时，它会在 30% 或 40% 时失败并出现错误:备份或恢复已中止。 Di
winforms - SMO 恢复失败/无法打开备份设备错误
我在尝试恢复 SQL Server 2008 R2 数据库时遇到错误: Restore failed for Server 'KIMO-PC'. 使用的代码: Server myServer
SQL Server : Why do use SMO?
我使用 SQL Server 已经有几年了。我听说过SMO，但我对此一无所知。使用它有什么好处？我应该在我的 SQL Server 项目(主要是数据仓库开发)中学习并开始使用 SMO 吗？为什么？最
.net - 与 SMO 连接共享交易
如何与 SMO 服务器连接共享交易？共享连接就这么简单 var connection = new SqlConnection(); var serverConnection = new ServerC
c# - 使用 smo 重命名数据文件
如何使用 SMO 重命名物理 .mdf .ndf .ldf 文件。 This这篇文章很有帮助，但我需要使用 C# SMO 对象。使用 SMO 服务器对象，我可以检索数据库，然后获取对数据文件对象的访
c# - 使用 SMO 收集依赖项时忽略触发器
我有一个系统可以在两个具有相同模式的数据库之间传输数据(用于开发目的)。 SMO dependency walker 除了触发器外工作得很好。如果我得到一个依赖项列表，我不关心触发器是否引入了对另一个
c# - 使用 SMO 找到要还原的备份文件
我能够使用 SMO 构建类似于 SSMS 中的“查找备份文件”对话框的 TreeView 。我可以列出服务器上的文件夹，如果有备份设备，它们也会被列出。我似乎无法复制的一件事是如何浏览备份文件以恢复最
c# - 找不到命名空间 'Smo'，尽管添加了引用
我已将 Microsoft.SqlServer.Management.Smo.dll 引用添加到我的项目中，但它仍然给我以下错误。引用的dll在C:\Program Files\Microsoft S
java - SMO，WEKA 中的顺序最小优化
我是 Weka 的新手。我想在 WEKA 中使用顺序最小优化。谁能告诉我如何继续？这是我的 Java 代码，但它不起作用: public class SVMTest { public void tes

首页

博学

6Ren·AI

商城

machine-learning - 如何在weka中使用svm(smo)的字符串数据