gpt4 book ai didi

python - 使用列中的数据创建新列

转载 作者:太空宇宙 更新时间:2023-11-04 00:08:52 28 4
gpt4 key购买 nike

这是我在 pandas 中的数据

      Movie        Tags
0 War film tank;plane
1 Spy film car;plane

我想用带有 0 和 1 的标签列创建新列,并在列的名称中添加前缀,如“T_”。

喜欢:

      Movie        Tags T_tank T_plane T_car
0 War film tank;plane 1 1 0
1 Spy film car;plane 0 1 1

例如,我有一些关于如何使用 split(";") 和 df.loc[:,'T_plane'] 逐行执行此操作的想法。但我认为这可能不是最佳方式。

问候

最佳答案

使用 sklearn 库:

from sklearn.preprocessing import MultiLabelBinarizer

mlb = MultiLabelBinarizer()

res = df.join(pd.DataFrame(mlb.fit_transform(df['Tags'].str.split(';')),
columns=mlb.classes_).add_prefix('T_'))

print(res)

Movie Tags T_car T_plane T_tank
0 War film tank;plane 0 1 1
1 Spy film car;plane 1 1 0

关于python - 使用列中的数据创建新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53193273/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com