gpt4 book ai didi

python - 通过将列表或字符串的列与另一个列表匹配来进行分组并创建新的数据框

转载 作者:太空宇宙 更新时间:2023-11-03 14:35:25 24 4
gpt4 key购买 nike

所以我有一个像这样的数据框:

<小时/>

|类别 |地址 |标签 |

cat1地址1't1,t2,t3'

cat2 addr2't4,t1,t3'

等等

我提取了一系列标签的唯一列表。

我想要:

标签|类别 |地址

t1 猫1 地址1 猫2地址2

t2 猫1 地址1

t3 cat1 地址1 猫2地址2

我很困惑如何在这里使用groupby?或者说是变形?

最佳答案

您可以使用:

<小时/>
df = (df.set_index(['category','address'])['tags']
.str.strip("'")
.str.split(', ', expand=True)
.stack()
.reset_index(level=2, drop=True)
.reset_index(name='tags')
.reindex_axis(['tags','category','address'], axis=1)
.sort_values('tags'))
print (df)
tags category address
0 t1 cat1 addr1
4 t1 cat2 adddr2
1 t2 cat1 addr1
2 t3 cat1 addr1
5 t3 cat2 adddr2
3 t4 cat2 adddr2

关于python - 通过将列表或字符串的列与另一个列表匹配来进行分组并创建新的数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46988033/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com