gpt4 book ai didi

python - 在 groupby Pandas 数据帧上获取不同的单词

转载 作者:行者123 更新时间:2023-11-30 22:18:43 25 4
gpt4 key购买 nike

如何根据另一列的分组依据获取一列的不同单词

我需要为每个 colA 值获取不同的 colB 单词

我的数据框:

colA     colB
US California City
US San Jose ABC
UK London 123
US California ZZZ
UK Manchester
UK London

请求数据帧(df):

col A    colB
US California
US City
US ABC
US ZZZ
US San
US Jose
UK London
UK 123
UK Manchester

编辑:

感谢@jezrael,我能够获得所需的数据框

我有另一个数据框(df2)

ColC        ColA      ColB
C1 US California
C1 US ABC
C2 UK LONDON

对于列 (colC) 的每个值,我需要 colB 字符串与先前获得的数据帧的交集。

必填:

ColC     n(df2_colBuniq)    n(df_df2_intersec_colB)
C1 2 2
C2 1 1

我尝试循环遍历每个唯一的 colC 值,但对于我拥有的大型数据帧,这需要相当长的时间。有什么建议吗?

最佳答案

用途:

<小时/>
df = (df.set_index('colA')['colB']
.str.split(expand=True)
.stack()
.reset_index(level=1, drop=True)
.reset_index(name='colB')
.drop_duplicates()
)
print (df)
colA colB
0 US California
1 US City
2 US San
3 US Jose
4 US ABC
5 UK London
6 UK 123
8 US ZZZ
9 UK Manchester

关于python - 在 groupby Pandas 数据帧上获取不同的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49299345/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com