gpt4 book ai didi

python - 如何在 pandas 数据框中执行分组、排序和连接字符串

转载 作者:行者123 更新时间:2023-12-01 06:58:49 26 4
gpt4 key购买 nike

我有这个 Pandas 框架:

PK  Line    Text    Source
1 1 The A
1 2 quick A
1 3 brown A
2 1 fox A
2 2 jumped A
3 1 over A
3 2 the A
3 3 lazy A
4 1 yellow A
5 1 dogs A
5 2 sam A

我需要到达:

PK  Text              Source
1 The quick brown A
2 fox jumped A
3 over the lazy A
4 yellow A
5 dogs sam A

我已经尝试过:

record.groupby('PK').apply(Lambda x: (' '.join(x)).sort_values('LINE', ascending))

但我似乎遗漏了一些东西。我怎样才能做到这一点?

谢谢!

最佳答案

看起来像groupby()和聚合:

df.groupby(['PK', 'Source'], as_index=False).Text.agg(' '.join)

您可以添加 sort_values('Line') 以确保行按顺序排列,例如

(df.sort_values('Line')
.groupby(['PK', 'Source'], as_index=False)
.Text.agg(' '.join)
)

输出:

   PK Source             Text
0 1 A The quick brown
1 2 A fox jumped
2 3 A over the lazy
3 4 A yellow
4 5 A dogs sam

关于python - 如何在 pandas 数据框中执行分组、排序和连接字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58719004/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com