gpt4 book ai didi

python - 一个 Hot Encoding 列中有多个标签

转载 作者:行者123 更新时间:2023-12-02 17:08:33 24 4
gpt4 key购买 nike

我有一个简单的数据集。

id,question,category,tags,day,quarter,group_id

1,What is your name,Introduction,Introduction,1,3,0

2,What is your name,Introduction,"Introduction, work",1,3,1

现在,如果您看到,在 tags 列中有多个用逗号分隔的输入。如果我尝试使用 pandas get_dummies 函数进行单热编码,我会将其作为单个列获取。但我想为每个标签创建列。我怎样才能做到这一点?

最佳答案

我相信需要str.get_dummies :

df1 = df['tags'].str.get_dummies(', ')
print (df1)

Introduction work
0 1 0
1 1 1

关于python - 一个 Hot Encoding 列中有多个标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50523537/

24 4 0