gpt4 book ai didi

python - 如何避免回归模型中的浮点值

转载 作者:太空宇宙 更新时间:2023-11-04 01:04:52 24 4
gpt4 key购买 nike

我正在尝试使用线性、SGDRegressor、ridge、套索等回归模型来预测 Wine 质量(范围从 1 到 10)。

数据集:http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv

独立值: volatile 酸、残糖、游离二氧化硫、总二氧化硫、酒精度依赖:质量

线性模型

regr = linear_model.LinearRegression(n_jobs=3)
regr.fit(x_train, y_train)
predicted = regr.predict(x_test)

LinearRegression 的预测值阵列([5.33560542,5.47347404,6.09337194,...,5.67566813, 5.43609198, 6.08189])

预测值是 float 而不是 (1,2,3...10)我尝试使用 numpy 对预测值进行舍入

predicted = np.round(regr.predict(x_test))` but my accuracy gone down with this attempt.

SGDRegressor 模型。

from sklearn import linear_model
np.random.seed(0)
clf = linear_model.SGDRegressor()
clf.fit(x_train, y_train)
redicted = np.floor(clf.predict(x_test))

SGDRegressor 的预测输出值:

array([ -2.77685458e+12,   3.26826414e+12,   4.18655713e+11, ...,
4.72375220e+12, -7.08866307e+11, 3.95571514e+12])

这里我无法将输出值转换为整数。

谁能告诉我使用这些回归模型预测 Wine 质量的最佳方法。

最佳答案

您正在进行回归,因此输出本质上是连续的。

您应该注意的是,您关于预测 Wine 质量的小项目不是分类问题。响应变量 y,即 Wine 质量,具有内在顺序,这意味着 6 分严格优于 5 分。它不是分类变量,不同的数字只代表不同的组,组之间没有可比性。

关于python - 如何避免回归模型中的浮点值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30915791/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com