gpt4 book ai didi

python - 我想将 sm.OLS(y_train,x_train).fit().summary() 的结果存储到数据帧中,以便我可以使用 P>|t|通过代码实现值(value)

转载 作者:太空宇宙 更新时间:2023-11-03 21:03:30 27 4
gpt4 key购买 nike

我想使用 P>|t|值并与 vif 值进行比较,并使用代码自动消除一些列。所以我想得到 P>|t|分别

x = df.drop(['price'],axis=1)
y = df['price']

from sklearn.model_selection import train_test_split x_train,x_test,y_train,y_test=train_test_split(x,y,train_size=0.7,test_size=0.3, random_state=100)

#Applying stats model
import statsmodels.api as sm
x_train = sm.add_constant(x_train)
lg1 = sm.OLS(y_train,x_train).fit()
data = lg1.summary()
data

所以我想得到 P>|t|分别。我尝试保存为 csv,如下所示:

data.to_csv("data.csv")
data.to_html("data.html")

我也尝试过:

pd.DataFrame(data)

最佳答案

为了获得 p 值

results = sm.OLS(y, X).fit()

显示在输出表中列名“P>|t|”下你可以使用

pvalues = results.pvalues

pvalues = results.summary2().tables[1]['P>|t|']

并获取具有所需 p 值的 pandas 系列

关于python - 我想将 sm.OLS(y_train,x_train).fit().summary() 的结果存储到数据帧中,以便我可以使用 P>|t|通过代码实现值(value),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55572486/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com