gpt4 book ai didi

python - 在 DataFrame 中编码多个标签

转载 作者:太空宇宙 更新时间:2023-11-03 14:41:42 24 4
gpt4 key购买 nike

给定一个列表列表,其中每个子列表都是一个装满字母的桶,例如:

L=[['a','c'],['b','e'],['d']]

我想将每个子列表编码为我的 DataFrame 中的一行,如下所示:

    a   b   c   d   e
0 1 0 1 0 0
1 0 1 0 0 1
2 0 0 0 1 0

让我们假设字母只是从“a”到“e”。我想知道如何完成一个功能来做到这一点。

最佳答案

您可以使用 sklearn 库:

import pandas as pd
from sklearn.preprocessing import MultiLabelBinarizer

L = [['a', 'c'], ['b', 'e'], ['d']]

mlb = MultiLabelBinarizer()

res = pd.DataFrame(mlb.fit_transform(L),
columns=mlb.classes_)

print(res)

a b c d e
0 1 0 1 0 0
1 0 1 0 0 1
2 0 0 0 1 0

关于python - 在 DataFrame 中编码多个标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52718264/

24 4 0