gpt4 book ai didi

python - 使用哪些特征进行回归或分类?

转载 作者:行者123 更新时间:2023-11-30 09:28:00 24 4
gpt4 key购买 nike

有没有办法确定哪些特征与我的机器学习模型最相关。如果我有 20 个功能,是否有一个函数可以决定我应该使用哪些功能(或者可以自动删除不相关的功能)?我计划为回归或分类模型执行此操作。

我想要的输出是最相关的值列表和预测

import pandas as pd
from sklearn.linear_model import LinearRegression

dic = {'par_1': [10, 30, 11, 19, 28, 33, 23],
'par_2': [1, 3, 1, 2, 3, 3, 2],
'par_3': [15, 3, 16, 65, 24, 56, 13],
'outcome': [101, 905, 182, 268, 646, 624, 465]}

df = pd.DataFrame(dic)

variables = df.iloc[:,:-1]
results = df.iloc[:,-1]

print(variables.shape)
print(results.shape)


reg = LinearRegression()
reg.fit(variables, results)

x = reg.predict([[18, 2, 21]])[0]
print(x)

最佳答案

您正在寻找的术语是特征选择:它包括确定哪些特征与您的分析最相关。 scikit-learn 库有一整节专门介绍它 here .

另一种可能性是诉诸降维技术,例如 PCA (主成分分析)或随机预测。每种技术都有其优点和缺点,很大程度上取决于您拥有的数据和具体应用。

关于python - 使用哪些特征进行回归或分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57040515/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com