gpt4 book ai didi

python - 如何重建行中的虚拟数据?

转载 作者:行者123 更新时间:2023-11-28 22:14:48 25 4
gpt4 key购买 nike

我在 stackoverflow 中阅读了这个问题的解决方案,但没有人具体说明何时需要分隔多个列。例如:

输入 enter image description here

输出

movieId genres
1 Adventure|Animation|Children|Comedy|Fantasy
2 Adventure|Children|Fantasy
3 Comedy|Romance
4 Comedy|Drama|Romance
5 Comedy
6 Action|Crime|Thriller
7 Comedy|Romance

我怎样才能用 pandas 做到这一点?

最佳答案

使用dot使用 | 的列名并通过 rstrip 删除最后一个 | :

print (df1)
movieId Action Adventure Animation Children Comedy Crime Drama \
0 1 0 1 1 1 1 0 0
1 2 0 1 0 1 0 0 0
2 3 0 0 0 0 1 0 0
3 4 0 0 0 0 1 0 1
4 5 0 0 0 0 1 0 0
5 6 1 0 0 0 0 1 0
6 7 0 0 0 0 1 0 0

Fantasy Romance Thriller
0 1 0 0
1 1 0 0
2 0 1 0
3 0 1 0
4 0 0 0
5 0 0 1
6 0 1 0

df = df1.set_index('movieId')
df2 = df.dot(df.columns + '|').str.rstrip('|').reset_index(name='genres')

print (df2)
movieId genres
0 1 Adventure|Animation|Children|Comedy|Fantasy
1 2 Adventure|Children|Fantasy
2 3 Comedy|Romance
3 4 Comedy|Drama|Romance
4 5 Comedy
5 6 Action|Crime|Thriller
6 7 Comedy|Romance

关于python - 如何重建行中的虚拟数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53239832/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com