gpt4 book ai didi

python - 如何在 pandas 数据框中连接多个文本字段

转载 作者:行者123 更新时间:2023-12-01 00:35:49 25 4
gpt4 key购买 nike

如何将 pandas 数据帧的某些文本列的唯一值连接到单个列中。例如:

data = [[1,"US","California","Los Angeles"],
[1,"US","California","San Francisco"],
[1,"US","California","San Diego"],
[1,"US","Texas","Austin"],
[2,"IND","Maharashtra","Mumbai"],
[2,"IND","Maharashtra","Pune"],
[2,"IND","Maharashtra","Nagpur"]]

df = pd.DataFrame(data, columns = ['Country_Id', 'Country','State','Place'])

从上面的数据框中,如何生成一个字段为 Country_Id 的输出第二个是包含唯一值 Country 的文本字段, State , Place .

喜欢:

  • 1、美国加利福尼亚州德克萨斯州洛杉矶旧金山圣地亚哥奥斯汀
  • 2,IND 马哈拉施特拉邦 孟买 浦那 那格浦尔

请忽略组合文本字段的含义

最佳答案

unique和genexp上使用groupbyapply以及双重join

df.groupby('Country_Id').apply(lambda x: ' '.join(' '.join(x[col].unique()) for col in x))
.to_frame('Country-State-Place')


Out[434]:
Country-State-Place
Country_Id
1 US California Texas Los Angeles San Francisco San Diego Austin
2 IND Maharashtra Mumbai Pune Nagpur

关于python - 如何在 pandas 数据框中连接多个文本字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57775687/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com