- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我做了一个非常简单的程序,它从 csv 文件中获取数据列,这里是文件数据的简短预览:
,matchId,blue_win,blueGold,blueMinionsKilled,blueJungleMinionsKilled,blueAvgLevel,redGold,redMinionsKilled,redJungleMinionsKilled,redAvgLevel,blueChampKills,blueHeraldKills,blueDragonKills,blueTowersDestroyed,redChampKills,redHeraldKills,redDragonKills,redTowersDestroyed
0,3493250918.0,0,24575.0,349.0,89.0,8.6,25856.0,346.0,80.0,9.2,6.0,1.0,0.0,1.0,12.0,2.0,0.0,1.0
1,3464936341.0,0,27210.0,290.0,36.0,9.0,28765.0,294.0,92.0,9.4,20.0,0.0,0.0,0.0,19.0,2.0,0.0,0.0
2,3428425921.0,1,32048.0,346.0,92.0,9.4,25305.0,293.0,84.0,9.4,17.0,3.0,0.0,0.0,11.0,0.0,0.0,4.0
3,3428347390.0,0,20261.0,223.0,60.0,8.2,30429.0,356.0,107.0,9.4,7.0,0.0,0.0,3.0,16.0,3.0,0.0,0.0
4,3428350940.0,1,30217.0,376.0,110.0,9.8,23889.0,334.0,60.0,8.8,16.0,3.0,0.0,0.0,8.0,0.0,0.0,2.0
5,3494458885.0,1,25470.0,362.0,82.0,9.2,22856.0,319.0,86.0,8.8,9.0,1.0,0.0,0.0,7.0,1.0,0.0,0.0
6,3463320642.0,1,25391.0,350.0,96.0,9.2,23236.0,345.0,80.0,8.6,8.0,2.0,0.0,0.0,5.0,1.0,0.0,1.0
...
我删除了不必要的列,并使用 30% 的数据作为测试数据运行测试,以预测蓝队赢得比赛的准确性:
import pandas as pd
import numpy as np
import sklearn
from sklearn import linear_model
df = pd.read_csv('MatchTimelinesFirst15.csv', delimiter=',')
predict = "blue_win"
df = df.drop('Unnamed: 0', axis=1)
df = df.drop('redDragonKills', axis=1)
df = df.drop('blueDragonKills', axis=1)
# print(df.describe())
x = np.array(df.drop([predict], axis=1))
y = np.array(df[predict])
for _ in range(500):
x_train, x_test, y_train, y_test = sklearn.model_selection.train_test_split(x, y, test_size=0.30)
# print('{0}, {1}'.format(type(x_train), x_train))
linear = linear_model.LinearRegression()
# trains model
linear.fit(x_train, y_train)
acc = linear.score(x_test, y_test)
print('Accuracy: {0}'.format(acc))
但即使通过循环训练 500 次,我的准确性也不会提高?我一直得到相同范围的结果:
Accuracy: 0.39030223064480596
Accuracy: 0.3980014684661366
Accuracy: 0.3840247556358104
Accuracy: 0.3939949181269252
Accuracy: 0.38657487661026535
Accuracy: 0.3950506154649621
Accuracy: 0.3925506648304995
...
非常感谢任何帮助,包括改进方面的帮助,因为我是 python 和机器学习的新手。
最佳答案
您不会使用循环进一步训练模型。您每 500 次重新开始,唯一不同的是训练-测试拆分的随机初始化。
至于分类器的改进,我会避开线性回归。回归与分类不是一回事。分类将预测分类类别标签,而回归将预测连续数量。
因为你想知道蓝队何时获胜,所以你有一个二元分类问题。蓝队要么赢,要么不赢。
尝试像 SVM 这样的分类模型.
祝你好运!
关于python - 运行多个 LinearRegressions 测试时准确度没有增加,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72290141/
我做了一个非常简单的程序,它从 csv 文件中获取数据列,这里是文件数据的简短预览: ,matchId,blue_win,blueGold,blueMinionsKilled,blueJungleMi
我正在尝试解决线性回归问题,并且正在使用 sklearn 中的 LinearRegression() 函数。是否可以显示权重和偏差? 最佳答案 拟合模型后,使用coef_属性来检索权重并使用inter
我正在尝试使用 scikit-learn 库进行特征选择。我的数据很简单。行是样本,列是特征。虽然原来的类标签是 X 和 Y,但我将它们更改为数字以进行线性回归,X 为 0,Y 为 1。 G1 G2
我在 Python ( sklearn ) 中进行多元线性回归,但出于某种原因,系数未作为列表正确返回。相反,返回列表中的列表: from sklearn import linear_model cl
import os import pandas as pd import matplotlib.pyplot as plt from sklearn.pipeline import Pipeline
我正在使用 sklearn.linear_model 和模块 LinearRegression 执行一个简单的自回归模型。你可以在下面看到我的代码。训练数据集位于 train 中,X 包含目标的滞后版
我有一个这样的列表: list1 = [['2012', '1', '3', '1', '832.0', '261.0', '100.00'], ['2012', '1', '5', '1', '5
当我尝试使用 scikit-learn LinearRegression 时,模型表现不佳,但是,当我尝试 scipy 线性回归时,它运行良好,数据集很简单,逻辑或者代码有缺陷吗? 我尝试了多个 se
我是机器学习的初学者。这只是一个简单的问题,LinearRegression()中的coef_代表什么?我知道它代表系数,但我不明白这些值,高且正的 coef_ 是否意味着更强的关系? 而且,如果 c
从一个示例开始,我尝试进行线性回归。问题是我得到了错误的结果。作为拦截器我应该有:2.2。 我尝试添加在另一篇文章中找到的 .optimizer.setStepSize(0.1),但仍然得到一个奇怪的
我正在一个简单的数据集上尝试 scikit-learn LinearRegression 模型(来自 Andrew NG coursera 类(class),我并不重要,请查看图表以供引用) 这是我的
所以我正在开展一个项目,该项目使用 RFECV 进行特征选择,然后对所选变量进行岭回归。 数据集的结构方式我有一个 train_y = 因变量,train_x = 数据框中的所有其他内容(变量在其他模
我想要模型的公式以便在其他语言/项目中使用它。有没有办法从模型中导出公式? 我将使用 sklearn linear regression model . 我最终想做的是:给定一个公式 f() 和数据集
我正在尝试进行多变量线性回归。但我发现 sklearn.linear_model 工作起来很奇怪。这是我的代码: import numpy as np from sklearn import line
我正在尝试根据各种其他因素预测调用中心的调用量。我有一个相当干净的数据集,也相当小,但足够了。我能够训练和测试历史数据并获得分数、摘要等。我一生都无法弄清楚如何使用预测因子数据来预测 future 的
我一直在尝试按照 bigdataexaminer 上的教程通过线性回归来拟合这些数据。直到此时一切都运行良好。我从 sklearn 导入了 LinearRegression,并打印出系数的数量就好了。
我最近开始使用线性回归进行机器学习。我使用了 LinearRegression (lr) 来预测一些值。事实上,我的预测很糟糕,我被要求更改超参数以获得更好的结果。 我使用以下命令获取超参数: lr.
from sklearn.linear_model import LinearRegression 在 Jupyter Notebook 中给了我这个错误: ---------------------
据我了解,scikit-learn 中的 LinearRegression 类和 SGDRegressor 类都执行线性回归。但是,只有 SGDRegressor 使用梯度下降作为优化算法。 那么Li
我正在尝试计算日期值对的趋势值。 我正在使用 Robert Sedgewick 和 Kevin Wayne 的 LinearRegression.java。 https://algs4.cs.prin
我是一名优秀的程序员,十分优秀!