- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试使用 Java 中 LIBSVM 的 epsilon-SVR 来预测单变量时间序列(我的数据由两列、一个时间戳和一个数值组成)。
当我不使用功能时,仅将数组索引视为功能(我知道它不值得信赖),它始终返回相同的值。如果我使用滑动窗口,即预测时间 t 时的值的特征是时间 t-1,t-2,..., t-sliding_window 时的值,它总是返回 NaN。
我按照上面的方法训练模型:
public svm_model train(double[] series, int svmType, int kernelType, int degree, double gamma, double coef0, double C, double eps, double p, int shrinking, int nFeatures)
{
series = normalize(series)
svm_parameter params = new svm_parameter();
svm_problem problem = new svm_problem();
svm_node node = null;
//----------Set parameters----------
params.svm_type = svmType;
params.kernel_type = kernelType;
params.degree = degree;
params.gamma = 1/nFeatures;
params.coef0 = coef0;
params.C = C;
params.eps = eps;
params.cache_size=100;
params.p = p;
params.shrinking= shrinking;
//----------Define problem----------
problem.l = series.length;
problem.y = series;
problem.x = new svm_node[series.length][];
for(int i=0;i<series.length;i++)
{
problem.x[i] = new svm_node[1];
node = new svm_node();
node.index = 0;
node.value = i;
problem.x[i][0] = node;
}
//----------Generate model----------
svm_model svm_model = svm.svm_train(problem,params);
return svm_model;
}
public svm_model trainSlidingWindow(double[] series, int svmType, int kernelType, int degree, double gamma, double coef0, double C, double eps, double p, int shrinking, int nFeatures, int slidingWindow)
{
series = normalize(series)
svm_parameter params = new svm_parameter();
svm_problem problem = new svm_problem();
svm_node node = null;
//----------Set parameters----------
params.svm_type = svmType;
params.kernel_type = kernelType;
params.degree = degree;
params.gamma = 1/nFeatures;
params.coef0 = coef0;
params.C = c;
params.eps = eps;
params.cache_size=100;
params.p=p;
params.shrinking= shrinking;
//----------Define problem----------
problem.l = series.length;
problem.y = series;
problem.x = new svm_node[series.length][slidingWindow];
for(int i=0;i<series.length;i++)
{
problem.x[i] = new svm_node[slidingWindow];
for(int j=0; j<slidingWindow;j++)
{
node = new svm_node();
node.index = slidingWindow-(j+1);
if(i-(j+1) <0)
node.value = Double.NaN;
else
node.value = series[i-(j+1)];
problem.x[i][j] = node;
}
}
//----------Generate model----------
svm_model svm_model = svm.svm_train(problem,params);
return svm_model;
}
预测结果如下:
public double[] predict(double[] series, svm_model model, int steps)
{
series = normalize(series);
double[] yPred = new double[steps];
for(int i=0;i<steps;i++)
{
svm_node[] nodes = new svm_node[1];
svm_node node = new svm_node();
node.index = 0;
node.value = series.length + i;
nodes[0] = node;
yPred[i] = svm.svm_predict(model,nodes);
}
return denormalize(yPred);
}
public double[] predictSlidingWindow(double[] series, svm_model model, int steps, int slidingWindow)
{
series = normalize(series);
double[] yPred = new double[steps];
double[] aux = new double[slidingWindow+steps];
System.arraycopy(series,series.length-slidingWindow,aux,0, slidingWindow);
for(int i=0;i<steps;i++)
{
svm_node[] nodes = new svm_node[slidingWindow];
for(int j=0;j<slidingWindow;j++)
{
svm_node node = new svm_node();
node.index = slidingWindow-(j+1);
node.value = aux[i+j];
nodes[j] = node;
}
yPred[i] = svm.svm_predict(model,nodes);
aux[slidingWindow+i] = yPred[i];
}
return denormalize(yPred);
}
我做错了什么?提前致谢。
最佳答案
显然,对数据进行归一化并将 gamma 参数的值更改为 1 解决了问题。
当数据域太大时,在构建支持 vector 回归模型时对其进行标准化是一种很好的方法,可以提高预测质量并缩短执行时间。
关于java - 带有 LIBSVM 的 epsilon-SVR,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49682388/
我正在考虑使用 LibSVM我正在创建所需的特征向量。 在几乎所有的示例数据中,特征都有一个顺序,例如: +1 1:3 2:1 3:5 4:2 10:8 想知道这个顺序是否重要,例如: +1 4:2
对于相同的数据集和参数,LibSVM 和 scikit-learn 的 SVM 实现的精度不同,尽管 scikit-learn also uses LibSVM internally 。 我忽略了什么
当我打开 LIBSVM 训练数据的示例文件时,我无法理解文件结构。有人可以告诉我如何制作吗? 以下是我用于预测歌曲的歌曲作者的训练数据(作为示例): 特征1:歌词中“爱”字的数量 特征2:歌词中“ f
当我打开 LIBSVM 训练数据的示例文件时,我无法理解文件结构。有人可以告诉我怎么做吗? 下面是我预测歌曲作者的训练数据(作为例子): 特征一:歌词中“爱”字的数量 特征2:歌词中“ friend
我是 python 的新手,我正在尝试使用 libsvm。我正在尝试在 grid.py 的帮助下进行交叉验证。我从数据库中获取数据,因此它不是稀疏形式。有什么办法可以按照grid.py中数据格式的要求
我有一个 LIBSVM 缩放模型(使用 svm-scale 生成),我想将它移植到 PySpark。我天真地尝试了以下方法: scaler_path = "path to model" a = Min
我不明白LIBLINEAR API中bias参数的含义。为什么在训练时由用户指定?难道它不应该只是从分离超平面到原点的距离,这是学习模型的参数吗? 这来自自述文件: struct problem {
对于 LibSVM。 在'A Practical Guide to Support Vector Classification'中建议使用m数来表示m-category属性。例如 {red, gree
是否有任何脚本可以将制表符分隔的数据文件转换为 libSVM 数据格式?例如我未标记的数据: -1 9.45 1.44 8.90 -1 8.12 7.11 8.90-1 8.11 6.12 8.78
我的数据有一个奇怪的结果,我想知道您或其他任何人是否对此有任何见解.. 我有大约 5000 个数据和大约 16000 个属性,我用每个类的 2000 个数据(我只有两个类)训练了我的 RBF svm(
我想知道为什么 libSVM 在使用或不使用概率进行预测时会给出不同的准确度结果,并且我在 this page 找到了常见问题解答其中说 Q: Why using svm-predict -b 0 a
我正在使用 LIBSVM for matlab。当我使用回归 SVM 时,它输出的概率估计是一个空矩阵,而在使用分类时此功能运行良好。这是正常行为吗,因为在 LIBSVM 自述文件中它说: -b pr
我想知道为什么 libSVM 在使用或不使用概率进行预测时会给出不同的准确度结果,并且我在 this page 找到了常见问题解答其中说 Q: Why using svm-predict -b 0 a
我已经扩展了我的训练数据并尝试进行交叉验证以获得最佳参数,但我不知道该怎么做。我尝试读取缩放后的训练数据并将它们分配给 svm_problem 变量: svm_node My_svm_node[164
我正在使用 LibSVM 进行一些多类分类。我使用 LibSVM 的 MATLAB 接口(interface)训练模型。然后,我以 C 语言可以识别的格式保存该模型。现在我想在 C 语言中使用 svm
我的目标是制作一个多类分类器,用于处理不同的文件,这些文件将标记至少两个类(或标签)。这些文件是议会倡议的,因此每个文件都将在同义词库中以至少一对值进行索引。 我在Python版本中使用“libsvm
我打算在 MATLAB 中安装 libSVM 并下载了该文件。 但是在 MATLAB 中似乎已经有了函数,svmtrain、svmpredict 等等。 MATLAB 是否已附带 LIBSVM? 最佳
我想使用从 Libsvm 模型派生的参数来预测新数据(不是在 matlab 中)。我想问模型中的支持向量(nSV,sv_coef,SVs)是否是按照模型中Label的顺序排列的?下面是使用线性核从fi
我有一个数据集,负标签值的数量是正标签值数量的 163 倍,所以我有一个不平衡的数据集。我已经尝试过了: model = svmtrain(trainLabels, trainFeatures, '-
我正在使用 libsvm 进行多元回归。我有一些缺失值的数据。例如,我有 10 个实例,每个实例有 10 个节点,每个节点有 10 个与其关联的链接。我需要使用 10 个实例来训练这 10 个节点。但
我是一名优秀的程序员,十分优秀!