python Pandas : Join on unique column values and concatenate-6ren

python Pandas : Join on unique column values and concatenate

转载作者：太空宇宙更新时间：2023-11-03 15:16:03

24

4

我有三个 Pandas 数据帧，df1、df2、 和 df3，如下所示:

import pandas as pd
import numpy as np
df1 = pd.DataFrame({'id' : ['one', 'two', 'three'], 'score': [56, 45, 78]})
df2 = pd.DataFrame({'id' : ['one', 'five', 'four'], 'score': [35, 81, 90]})
df3 = pd.DataFrame({'id' : ['five', 'two', 'six'], 'score': [23, 66, 42]})

我如何根据 id 连接这些数据框，然后将它们的列连接在一起？所需的输出如下:

#join_and_concatenate by id:

id   score(df1)  score(df2)  score(df3)
one    56            35         NaN
two    45            NaN        66
three  78            NaN        NaN
four   NaN           90         NaN
five   NaN           81         23
six    NaN           NaN        42

我找到了一个相关的 page谈到 merge()、concatenate() 和 join() 但我不确定其中任何一个都能满足我的要求。

最佳答案

concat 可能有更好的方法，但这应该可行:

In [48]: pd.merge(df1, df2, how='outer', on='id').merge(df3, how='outer', on='id')
Out[48]: 
      id  score_x  score_y  score
0    one       56       35    NaN
1    two       45      NaN     66
2  three       78      NaN    NaN
3   five      NaN       81     23
4   four      NaN       90    NaN
5    six      NaN      NaN     42

[6 rows x 4 columns]

得到你想要的答案:

In [54]: merged = pd.merge(df1, df2, how='outer', on='id').merge(df3, how='outer', on='id')

In [55]: merged.set_index('id').rename(columns={'score_x': 'score(df1)', 'score_y': 'score(df2)
', 'score': 'score(df3)'})
Out[55]: 
       score(df1)  score(df2)  score(df3)
id                                       
one            56          35         NaN
two            45         NaN          66
three          78         NaN         NaN
five          NaN          81          23
four          NaN          90         NaN
six           NaN         NaN          42

[6 rows x 3 columns]

关于 python Pandas : Join on unique column values and concatenate，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20975526/

24

4

0

文章推荐： python - url 中没有 pk 的 Django UpdateView

文章推荐： python - 从 threading.Thread 继承自定义类

文章推荐： ssl - 自定义域丢包

文章推荐： c# - 从 Identity.EntityFramework IdentityUser 中排除属性

mysql - UNIQUE、UNIQUE KEY 和 CONSTRAINT 'name' UNIQUE 有什么区别？
我想在 MySQL 中创建一个基本的 users 表。我不希望数据库中出现重复的电子邮件或重复的用户名。在创建表时防止这种情况的最佳方法是什么？和以下有什么区别: 1. UNIQUE(用户名)，
unique - 检测到 "unique"匿名用户
不可能将用户或请求识别为唯一，因为欺骗是微不足道的。但是，有一些方法组合起来可以阻止作弊尝试并为用户提供准独特的地位。我知道以下内容: IP 地址 - 将每个访问者的 IP 地址存储在某种数据库中
sql-server - sql server : Unique constraint generates unique key and unique index
我有 2 个表: attCatAppSet, attCatAppSet_translation 在这两个表上，我对 2 列(不是主键)应用了唯一约束，因此列对值不能重复。 GO ALTER TABLE
mysql - Django/MySQL : Making non-unique field unique fails even if field values are unique
我目前有这个: class Committee(models.Model): # ...some fields... committee_xml_id = models.Integer
mysql - 如何更改表以将列从 UNIQUE 更改为 NOT UNIQUE？
这个问题在这里已经有了答案: 关闭10 年前。 Possible Duplicate: how to alter live mysql table to make a key non unique
【C++ STL基础入门教程】C++ unique(STL unique)算法详解
unique() 算法可以在序列中原地移除重复的元素，这就要求被处理的序列必须是正向迭代器所指定的。在移除重复元素后，它会返回一个正向迭代器作为新序列的结束迭代器。可以提供一个函数对象作为可选的第三个
django - 从我的模型字段中将 unique=True 更改为 unique=False
我的模型中有一个这样的字段 name = models.CharField(max_length=100, unique=True) 但现在该表/模型有很多数据，需要更改True 到 False 但无
Typeorm:列选项中@Unique 装饰器和{ unique: true } 之间有什么区别？
在 Typeorm 中，您可以在列选项中设置唯一标志，或将列设置为实体的唯一。你什么时候会使用什么，有什么区别？@Unique(["firstName"]) https://typeorm.io/#
unique.default(x) unique() 中的 R 错误仅适用于向量
我创建了一个名为 state 的数据集来自内置矩阵state.x77有两个连续变量(人口和收入)和两个因素变量(区域和面积)。我使用 tapply() 计算了按地区划分的平均收入, by() , a
database - SQLite - 表约束 UNIQUE 和列约束 UNIQUE 之间有什么区别？
关于 SQLite 的问题。在 CREATE TABLE SQL 中，我们可以通过任何一种方式添加 UNIQUE 约束:列约束或表约束。我的问题很简单。它们的工作方式不同吗？我能找到的唯一区别是，
python - 'NoneType' 对象没有属性 'unique' 但我没有使用 'unique' 属性
我在 Django 1.8 中构建模型，我正在使用抽象继承(我假设这是导致问题的原因)。我有抽象模型，然后我有基于这些抽象模型的模型。我在某些模型之间也有 ForeignKey 和 ManyToMan
mysql - UNIQUE INDEX 和 UNIQUE KEY 有什么区别？
我见过几个示例表，一个是 UNIQUE INDEX，另一个是 UNIQUE KEY。两者有什么区别？？还是两者都一样？最佳答案 CREATE TABLE KEY 通常是 INDEX 的同义词。您可
python - 为什么 pd.unique() 比 np.unique() 快？
我试着比较了两者，一个是pandas.unique()，另一个是numpy.unique()，我发现后者实际上超过了第一个。我不确定卓越是否是线性的。谁能告诉我为什么在代码实现方面存在这种差异？在
powershell - Get-Unique 和 select-object -unique 的区别
使用 PowerShell，我通过“import-csv”将文件中的 csv-data 导入对象 $csvList。这个 csv 数据有一个名为 Benutzer 的列。当做这样的事情时: $csvL
mysql - SQL 约束 : Unique value in a non-unique column
我有一个名为 GroupMembers 的表，它表示参与网站上某些社区的用户列表。列看起来像这样: groupId | accountId | role 如您所见，里面有一个名为“role”的
安卓 : Unique Id for android device to identify the unique device
我需要一个不会因 Android 设备而改变的 ID，它在任何时候都应该是唯一的，即使 WIFI、SIM 卡、蓝牙不存在，以及当用户重置他/她的手机或刷新新操作系统时也是如此。我知道这些 Id。IM
java - JPA - @Column (unique=true) - 拥有 'unique' 属性的真正意义是什么？
假设我有“主题”表 CREATE TABLE subject (id int PRIMARY KEY, name VARCHAR(255) **UNIQUE**) 和相关的映射对象， @Entity
MySQL : how to create custom unique key combination based on year and a unique no
好的，让我解释一下场景。我有一个“订单”表，其中有一个自动增量键“orderno”。该表也有一个字段“orderdate”。我想要的是格式化的订单号。 (orderno_formatted) 采用以下
c++ - boost multi_index : retrieve unique values of a non-unique key
我有一个 boost::multi_index_container 其元素是这样的结构: struct Elem { A a; B b; C c; }; 主键(在数据库意义上)
MySQL:如何将 varchar(255) UNIQUE 列更改为 UNIQUE Text NOT NULL？
当前列是 VARCHAR(255) NOT NULL，那么如何将其更改为 TEXT NOT NULL？注意:要更改其属性类型的列是另一列的 UNIQUE KEY 组合。例如唯一键(名称、描述) 列

首页

博学

6Ren·AI

商城

python Pandas : Join on unique column values and concatenate