gpt4 book ai didi

apache-spark - 如何计算 Spark 逻辑回归中的 p 值?

转载 作者:行者123 更新时间:2023-12-02 04:41:47 25 4
gpt4 key购买 nike

我们正在使用 LogisticRegressionWithSGD 并想弄清楚我们的哪些变量可以预测以及具有什么意义。一些统计数据包 (StatsModels) 会返回每个术语的 p 值。低 p 值 (< 0.05) 表示对模型进行了有意义的添加。

我们如何从 LogisticRegressionWithSGD 模型中获取/计算 p 值?

对此的任何帮助表示赞赏。

最佳答案

这是一个非常古老的问题,但对迟到的人的一些指导可能很有值(value)。

LogisticRegressionWithSGD 是 deprecated .在那个版本中,模型本身没有提供真正的“摘要”信息集。如果您无法访问最新版本的 pyspark,则必须自己计算每个功能的 P 值。 Here is a nice intro to doing that by "hand".

如果您 可以 获取当前版本的 pyspark,然后您将需要使用:pyspark.mllib.classification.LogisticRegressionWithLBFGS(文档 here)

关于apache-spark - 如何计算 Spark 逻辑回归中的 p 值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36944121/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com