gpt4 book ai didi

python - 使用 OneHotEncoder 拆分调查数据

转载 作者:行者123 更新时间:2023-11-30 22:38:14 25 4
gpt4 key购买 nike

我有一个包含调查结果的数据框,其中有选项 A-E,并且可以选择多个选项 - 选择可以是“A”或“A;C;D”等。

我将使用这些数据进行一些机器学习,并希望通过 OneHotEncoder 运行它,最终得到包含 1 和 0 的 5 列。

我的初始调查数据的示例是:

survey_data = pd.DataFrame({'Q1':  ['A','B','C','A;D', 'D;E', 'F']})

我最初尝试了 LabelEncoder 但显然最终获得了很多功能(而不仅仅是 A-E)。

Final results

最佳答案

您还可以使用MultilabelBinarizer为此:

inputX = [element.split(';') for element in survey_data['Q1']]

from sklearn.preprocessing import MultiLabelBinarizer
mlb = MultiLabelBinarizer()
transformedX = mlb.fit_transform(inputX)

#Out: transformedX
#array([[1, 0, 0, 0, 0, 0],
[0, 1, 0, 0, 0, 0],
[0, 0, 1, 0, 0, 0],
[1, 0, 0, 1, 0, 0],
[0, 0, 0, 1, 1, 0],
[0, 0, 0, 0, 0, 1]])

关于python - 使用 OneHotEncoder 拆分调查数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43645554/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com