gpt4 book ai didi

python - scikit-learn 中的逻辑回归特征值归一化

转载 作者:行者123 更新时间:2023-11-30 09:29:25 24 4
gpt4 key购买 nike

使用Python 2.7。问题是关于拟合方法。问题是针对特征(由参数 X 提供),如果存在非数字特征(例如字符串类型特征,如 MaleFemale) ,我是否需要,或者建议转换为数字特征(出于性能和其他原因)?另外,如果我有多值字符串类型要素(例如,要素地理可以是 San Francisco、San Jose、Mountain View 的任何值)等)

http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression.fit

问候,林

最佳答案

对 MhFarahani 的回答补充一点:是的,您需要将这些标签转换为数值(通常为 0 或 1)。对于性别之类的信息,您可能希望有一行 0 代表男性,1 代表女性,反之亦然。对于地理位置之类的东西,情况会更复杂一些。如果有合理数量的可能答案,您可以使用 pandas 中的 get_dummies 函数(查看文档 here )自动用行填充数据框来表示每个可能的位置;然后,您可以删除其中一行以使该位置成为“默认”位置。

关于python - scikit-learn 中的逻辑回归特征值归一化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39061109/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com