gpt4 book ai didi

python - 如何使用 scikit-learn 获得优势比和其他相关特征

转载 作者:太空狗 更新时间:2023-10-29 22:07:35 24 4
gpt4 key购买 nike

我正在经历这个odds ratios in logistic regression tutorial ,并试图用 scikit-learn 的逻辑回归模块得到完全相同的结果。使用下面的代码,我可以获得系数和截距,但我找不到找到教程中列出的模型的其他属性的方法,例如 log-likelyhood、Odds Ratio、Std。 Err., z, P>|z|, [95% Conf.间隔]。如果有人能告诉我如何用 sklearn 包计算它们,我将不胜感激。

import pandas as pd
from sklearn.linear_model import LogisticRegression

url = 'https://stats.idre.ucla.edu/wp-content/uploads/2016/02/sample.csv'
df = pd.read_csv(url, na_values=[''])
y = df.hon.values
X = df.math.values
y = y.reshape(200,1)
X = X.reshape(200,1)
clf = LogisticRegression(C=1e5)
clf.fit(X,y)
clf.coef_
clf.intercept_

最佳答案

您可以通过取系数的指数得到优势比:

import numpy as np
X = df.female.values.reshape(200,1)
clf.fit(X,y)
np.exp(clf.coef_)

# array([[ 1.80891307]])

至于其他统计数据,这些不容易从 scikit-learn 中获得(其中模型评估主要使用交叉验证完成),如果您需要它们,最好使用不同的库,例如 statsmodels .

关于python - 如何使用 scikit-learn 获得优势比和其他相关特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39626401/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com