gpt4 book ai didi

python - 将数字标志设置为数据框中的字符串

转载 作者:太空宇宙 更新时间:2023-11-04 10:05:28 26 4
gpt4 key购买 nike

我是 pandas 的新手,想知道处理字符串数据的最佳方式是什么?我正在考虑用一个标志对字符串进行编号,但我确信有更好的方法来做到这一点?字符串值将作为特征合并到 KNN 中。

假设有以下数据并假设我对我的类型进行了编号:

enter image description here

举个例子:这显然会给我一个could not convert string to float

knn = KNeighborsClassifier(n_neighbors=15)
knn.fit(df['Type'], df['Quantity'])

有没有办法不用把“类型”变成数字就可以做到这一点?

最佳答案

如您所见,Scikit-learn 不接受字符串值作为特征。您必须将每个字符串值转换为一些数字。你可以像你所做的那样添加一个标志列,正如@piRSquared 用 pandas 快捷方式显示的那样(也在 scikit-learn 中使用 LabelEncoder 完成)但是这会使用特定的数字顺序对你的食物类型的值进行编码,这可能会或可能不会感觉。肉真的是水果的两倍, bean 类比肉多 50%。

我个人会使用 pd.get_dummies(df['Type']) 为水果的每个值创建一个新特征。

关于python - 将数字标志设置为数据框中的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41230957/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com