gpt4 book ai didi

machine-learning - 在 LIBSVM 中生成模型文件

转载 作者:行者123 更新时间:2023-11-30 08:47:14 24 4
gpt4 key购买 nike

我正在研究生物信息学。我有一个氨基酸组成序列的数据集。我想使用 SVM 算法将这些氨基酸组成序列分为正类和负类。我正在使用 libsvm 工具对氨基酸序列进行分类。我拥有的数据集包含 3909 行。但是当我应用 libsvm 的 svm-train 函数来生成模型文件时,正在生成的模型文件包含 2233 行。所以我的数据集的实际维度从 3909 减少到 2233。我不明白为什么会发生这种情况..?请帮助我。

最佳答案

模型仅保留定义类所需的支持向量。坦率地说,我很惊讶它保留了这么多原始行。

您的术语不正确。 “维度”是特征(列)的数量,而不是行的数量。维数并没有减少。一种思考方式是,需要 2233 个观察值才能定义正负之间的整个边界。其他 1694 个点位于其他数据点“后面”,距离边界较远。

举一个非常简单的例子,将所有整数视为数据点。我们简单地对它们进行分类:所有大于 pi (3.14159...) 的点都在正集中;所有较小的都被标记为负。将其输入 SVM 算法——您得到的只是行:3是负数; 4为正。所有其他点都在其中一个“后面”。

这有帮助吗?

关于machine-learning - 在 LIBSVM 中生成模型文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32583088/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com