作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想加入以下两个数据框。
第一个数据框在一列中有多个键
>>> import pandas as pd
>>> df = pd.DataFrame(data={'col1': [1,2,3], 'key': ['x, y','y', 'z, x']})
>>> df
col1 key
0 1 x, y
1 2 y
2 3 z, x
对于第一个数据框中的每个键,我在第二个数据框中都有一个排序映射。像这样:
>>> df2 = pd.DataFrame(data= {'key': ['x','y','z'], 'value': ["v1,v2,
v3","v4,v3", "v5"]})
>>> df2
key value
0 x v1,v2, v3
1 y v4,v3
2 z v5
我希望所有值都位于一列中相应键的旁边。理想情况下像 col1 一样删除重复项(x 和 y 都有 v3)。
>>> df3
col1 key value
0 1 x, y v1, v2, v3, v4
1 2 y v4, v3
2 3 z, x v1, v2, v3, v5
最佳答案
检查
d=dict(zip(df2.key,df2.value))
df['New']=[','.join([d.get(y) for y in x.split(', ')]) for x in df.key]
现在我们删除重复的
df.New=df.New.str.split(',').apply(lambda x : ','.join(set(x)))
df
col1 key New
0 1 x, y v3,v1,v2,v4
1 2 y v3,v4
2 3 z, x v5,v3,v1,v2
关于python - 您可以在其中一个连接列中使用多个键连接数据框吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55443555/
我有 2 个表,它们的第一列都是 PRIMARY,这也是自动递增的。第一个表有 67 个条目,从 1 到 67,第二个表有 48 个条目。它们都有相同的列。我想从 Table2 中获取内容并将它们插入
我是一名优秀的程序员,十分优秀!