gpt4 book ai didi

python - 从拆分的 .csv 数据集制作线性回归模型的最佳方法?

转载 作者:太空宇宙 更新时间:2023-11-04 05:08:29 27 4
gpt4 key购买 nike

我通常对 Python 很陌生,而且我在制作线性回归模型时遇到了问题。我需要从大型 Excel 数据集 (.csv) 的训练和测试集中制作它。

我已经拆分了数据集:

import pandas as pd
import numpy as np

df = pd.read_csv('C:/Dataset.csv')
df['split'] = np.random.randn(df.shape[0], 1)
split = np.random.rand(len(df)) <= 0.75

training_set = df[split]
testing_set = df[~split]

我如何使用这个分割数据来建立一个使用平均误差的线性回归模型?

谢谢。

最佳答案

Scikit-learn很简单

import pandas as pd
from sklearn import linear_model
from sklearn.metrics import mean_absolute_error

加载数据集并将数据拆分为训练/测试集

X_train = df[split]
X_test = df[~split]

将目标分成训练/测试集

y_train = df.target[split]
y_test = df.target[~split]

创建线性回归对象

regr = linear_model.LinearRegression()

使用训练集训练模型

regr.fit(X_train, y_train)

预测目标

y_pred = regr.predict(X_test)

打印系数

print('Coefficients: \n', regr.coef_)

打印平均绝对误差

print("Mean absolute error: %.2f"
% mean_absolute_error(y_test, y_pred))

关于python - 从拆分的 .csv 数据集制作线性回归模型的最佳方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43708502/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com