gpt4 book ai didi

python - 使用 MultiLabelBinarizer python 进行解码

转载 作者:行者123 更新时间:2023-12-01 06:32:55 27 4
gpt4 key购买 nike

我的目标是一个如下所示的数据帧,使用 MultiLabelBinarizer 对我的数据帧(一次每一行)进行编码效果很好,而解码总是以错误的顺序输出数据。

这是一个简单的数据框(我的目标 y):

index   col2         col2     col3
0 Anton 230 DR
1 Leila 890 DR
2 Arjun 688 ENG

来自 sklearn 网站的示例

from sklearn.preprocessing import MultiLabelBinarizer
mlb = MultiLabelBinarizer()
encoded = mlb.fit_transform([['sci-fi', 'thriller', 'comedy']])
mlb.inverse_transform(encoded)

Ouput:
array(['comedy''sci-fi','thriller'])

The desired output should be:
['sci-fi', 'thriller', 'comedy'] ** NOT ** ['comedy''sci-fi','thriller']

最佳答案

尝试打印编码变量。我相信您遇到的麻烦是该函数正在将字符串“sci-fi”转换为字符序列。函数“fit transform”将“iterable of iterables”作为输入。

如果我是正确的,那么简单的修复就是这样:

encoded = mlb.fit_transform([['sci-fi'], ['thriller'], ['comedy']])

关于python - 使用 MultiLabelBinarizer python 进行解码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59807511/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com