gpt4 book ai didi

python - 使用逻辑回归进行预测 (Python Scikit Learn)

转载 作者:行者123 更新时间:2023-11-30 08:52:15 26 4
gpt4 key购买 nike

我对 logistic regression 比较陌生使用SciKit learn在Python中。在阅读了一些主题并观看了一些演示之后,我决定自己深入研究。

所以,基本上,我试图根据一些特征来预测客户的转化率。结果是有效 (1) 或无效 (0)。我尝试了KNN逻辑回归。使用KNN,我得到的平均准确度为0.893,使用逻辑回归0.994。后者看起来如此之高,这是否现实/可能?

无论如何:假设我的模型确实非常准确,我现在想导入具有相同特征列的新数据集并预测它们的转换(他们将于本月结束)。在上面的例子中,我使用 cross_val_score 来获取准确度分数。

我现在是否需要导入新集,以某种方式将该新集适合此模型。 (不再训练它,现在我只是想使用它)

有人可以告诉我如何继续吗?如果需要其他信息,请对此发表评论。

提前致谢!

最佳答案

对于统计问题:当然,它可能会发生,要么你的数据几乎没有噪音,要么评论中提到的 Clock Slave 场景。

对于分类器的导入,您可以pickle它(使用pickle模块将其保存为二进制文件,然后在需要时加载它并使用新数据上的 clf.predict() 方法

import pickle 

#Do the classification and name the fitted object clf
with open('clf.pickle', 'wb') as file :
pickle.dump(clf,file,pickle.HIGHEST_PROTOCOL)

然后你就可以加载它

import pickle 

with open('clf.pickle', 'rb') as file :
clf =pickle.load(file)

# Now predict on the new dataframe df as
pred = clf.predict(df.values)

关于python - 使用逻辑回归进行预测 (Python Scikit Learn),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45541356/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com