gpt4 book ai didi

apache-spark - 如何在pyspark的LogisticRegressionWithLBFGS中打印预测概率

转载 作者:行者123 更新时间:2023-11-30 08:50:56 24 4
gpt4 key购买 nike

我正在使用 Spark 1.5.1 并且,在 pyspark 中,在我使用以下命令拟合模型后:

model = LogisticRegressionWithLBFGS.train(parsedData)

我可以使用以下方式打印预测:

model.predict(p.features)

是否有一个函数可以在预测的同时打印概率分数?

最佳答案

你必须clear the threshold首先,这只适用于二元分类:

 from pyspark.mllib.classification import LogisticRegressionWithLBFGS, LogisticRegressionModel
from pyspark.mllib.regression import LabeledPoint

parsed_data = [LabeledPoint(0.0, [4.6,3.6,1.0,0.2]),
LabeledPoint(0.0, [5.7,4.4,1.5,0.4]),
LabeledPoint(1.0, [6.7,3.1,4.4,1.4]),
LabeledPoint(0.0, [4.8,3.4,1.6,0.2]),
LabeledPoint(1.0, [4.4,3.2,1.3,0.2])]

model = LogisticRegressionWithLBFGS.train(sc.parallelize(parsed_data))
model.threshold
# 0.5
model.predict(parsed_data[2].features)
# 1

model.clearThreshold()
model.predict(parsed_data[2].features)
# 0.9873840020002339

关于apache-spark - 如何在pyspark的LogisticRegressionWithLBFGS中打印预测概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33560820/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com