gpt4 book ai didi

python - 分割为 |并在 pandas 系列中找到独特的值(value)

转载 作者:行者123 更新时间:2023-12-02 02:30:07 24 4
gpt4 key购买 nike

我有来自 movielens 数据集的电影数据,我想从流派列中选择独特的流派。这是数据集

movies dataset

结果看起来像这样

result

有人可以帮助我从流派列中拆分并选择独特的流派吗?

谢谢

最佳答案

解决方案:

pd.unique(df["genres"].str.split("|", expand=True).stack())

输出:

array(['Adventure', 'Animation', 'Children', 'Fantasy',
'Horror','Action','Thriller'], dtype=object)

说明:

这部分将 genres 列的流派拆分为每个流派一列(输出是摘录):

df["genres"].str.split("|", expand=True)

0 1 2
0 Adventure Animation Children
1 Adventure Children Fantasy
2 Comedy None None

.stack() 将所有列堆叠为一列:

df["genres"].str.split("|", expand=True).stack()

0 Adventure
1 Animation
2 Children
3 Comedy
4 Fantasy

然后,pd.unique() 返回一个包含 Serie 唯一值的数组。

关于python - 分割为 |并在 pandas 系列中找到独特的值(value),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65159103/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com