python - 添加数据框并根据可用性划分结果-6ren

python - 添加数据框并根据可用性划分结果

转载作者：太空宇宙更新时间：2023-11-03 12:23:07

24

4

我想添加两个数据框，我可以通过添加功能来实现。现在我想根据初始数据帧(df1、df2、df3)中是否存在相应值来划分结果数据帧的每个值。例如。

df1 = pd.DataFrame([[1,2],[3,4]], index =['A','B'], columns = ['C','D'])
df2 = pd.DataFrame([[11,12], [13,14]], index = ['A','B'], columns = ['D','E'])
df3 = df1.add(df2, fill_value=0)

这会导致 df 像

     C   D     E
A  1.0  13  12.0
B  3.0  17  14.0

我需要一个像这样的 df:

     C    D     E
A  1.0  6.5  12.0
B  3.0  8.5  14.0

因为在两个数据框中都找到了 D 列，所以我将这些值除以 2。任何人都可以提供一个通用的解决方案，假设我需要添加超过 2 个数据帧(因此划分因子也会改变)并且每个数据帧中有超过 100 列。

最佳答案

我们可以一步水平连接所有 DF:

In [13]: df = pd.concat([df1,df2], axis=1).fillna(0)

这会产生:

In [15]: df
Out[15]:
   C  D   D   E
A  1  2  11  12
B  3  4  13  14

现在我们可以按列分组，计算平均值(mean):

In [14]: df.groupby(df.columns, axis=1).mean()
Out[14]:
     C    D     E
A  1.0  6.5  12.0
B  3.0  8.5  14.0

或者我们可以一步完成(感谢 @jezrael ):

In [60]: pd.concat([df1,df2], axis=1).fillna(0).groupby(level=0, axis=1).mean()
Out[60]:
     C    D     E
A  1.0  6.5  12.0
B  3.0  8.5  14.0

时间:

In [38]: df1 = pd.concat([df1] * 10**5, ignore_index=True)

In [39]: df2 = pd.concat([df2] * 10**5, ignore_index=True)

In [40]: %%timeit
    ...: df = pd.concat([df1,df2], axis=1).fillna(0)
    ...: df.groupby(df.columns, axis=1).mean()
    ...:
63.4 ms ± 2.39 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

In [41]: %%timeit
    ...: s = pd.Series(np.concatenate([df1.columns, df2.columns])).value_counts()
    ...: df1.add(df2, fill_value=0).div(s)
    ...:
28.7 ms ± 712 µs per loop (mean ± std. dev. of 7 runs, 1 loop each)

In [42]: %%timeit
    ...: pd.concat([df1,df2]).mean(level = 0)
    ...:
65.5 ms ± 555 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

In [43]: df1.shape
Out[43]: (200000, 2)

In [44]: df2.shape
Out[44]: (200000, 2)

当前获胜者: @jezrael(28.7 ms ± 712 µs)-恭喜!

关于python - 添加数据框并根据可用性划分结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45731261/

24

4

0

文章推荐： Android webview 加载对话框

文章推荐： c# - 计算 WPF 或 SVG 图形的坐标点

文章推荐： python - 计算字符串列表中子字符串的出现次数

JHipster 5 可用性
是否可以使用 JHipster 5(带有 Spring Boot 2)？我注意到在发行说明中提到了 JHipster 5 的工作，但看不到任何关于如何安装/运行 5 的“预览”版本的信息。最佳答案
Xcode 可用性 - 多屏幕
使用多个显示器时，有没有办法拆分 Xcode 界面？我有 2 台显示器，但仍然没有找到一种简单的方法在超过 1 台显示器上使用它(左侧的 Storyboard，右侧的代码) - 就像在 Androi
c# - XmlDocument 可用性
我正在尝试处理 uwp 应用程序中的 xml，我添加了引用和用法: using System.Xml; using System.Xml.XPath; 但是 private XmlDocument d
javascript - JSunit 可用性
JSunit 真的是 Junit 到 Javascript 的直接端口吗？所以我听说过，但我想知道为什么我的公司没有使用它。我的公司有很多聪明人，所以如果我们不使用它，我想知道 Jsunit 作为 j
sockets - SOCK_SEQPACKET 可用性？
当使用原始 TCP 套接字时，需要进行消息帧化，如 here 所述，带有长度前缀或分隔符。我今天遇到了“SOCK_SEQPACKET”套接字选项，它显然可以几乎透明地进行消息框架。目前“SOCK_
usability - 我们让它变得可靠。下一步是什么？可用性？
我在一个小型开发小组工作。我们正在构建和改进我们的产品。半年前我们无法考虑更高的特性，比如可用性，因为我们的产品有很多问题。许多错误、高技术债务、低性能和其他问题使我们无法专注于可用性。随着时间的
spring - 以编程方式控制 @RestController 可用性
是否可以通过编程方式控制@RestController来启用或禁用它？我不想只在每个 @RequestMapping 方法中编写代码来执行某种 if (!enabled) { return 404Ex
覆盖期间 Azure Blob 可用性
azure 的 blob 在被新版本覆盖时是否可供下载？根据我使用 Cloud Storage Studio 的测试，下载被阻止，直到覆盖完成，但是我的测试来自同一台计算机，因此我无法确定这是正确的
drop-down-menu - 可用性:动态下拉菜单填充
我一直认为(但出于某种原因从未实践过)动态生成且仅包含一个项目的下拉菜单应该自动选择该项目。这与我观察到的典型方法相反，即在顶部创建一个空白条目，您仍然必须与菜单交互以进行单个可用选择。例如，当我登
jquery - UI 可用性 - 重新排序和合并列
我正在为我的兄弟编写一个基于 Web 的小实用程序，他需要合并 CSV 文件中的列。我知道这样的事情肯定存在于某个地方，但这很大程度上是因为这是一个有趣的小练习。无论如何，我正在尝试找出最好/最简洁
javascript - Pinterest API 可用性
如您所知，pinterest api 现在似乎已关闭。( api.pinterest.com )在此站点中:http://tijn.bo.lt/pinterest-api ，它表示只读访问仍然有效。到
Android 可用性日历 View
我想为公寓可用性应用程序制作日历 View 。我的想法是从 MySQL 数据库获取日期范围(不可用日期)并将其显示在日历 View 中。我的日历 View 应该有 3 种不同的样式: 可用日期不可用
android - 响应 wifi 可用性
我究竟应该如何配置我的广播接收器以使我的应用程序响应 wifi 可用性的变化。不过，当应用程序未运行时，我并不真正关心对此使用react。我在这里试图完成的是，当应用程序运行时，我需要使本地数据库与
mysql - 可用性(时间间隔)表的数据库设计
在我的网络应用程序中，我有 parent 和保姆。保姆将声明工作时间(时间间隔)，该工作时间将存储在工作时间表中。家长也会每隔一段时间表达自己的需求(暂时不需要存储)。所以我设计了这样的可用性表
ios - 通知 CloudKit 可用性
概览我希望在 CloudKit 无法访问时收到通知。 CloudKit 可能无法访问的可能场景: CloudKit 服务器不可访问互联网连接不可用。迄今为止所做的尝试: 观察 CKAccount
iphone - @class @synthesize 可用性
好的，我有我为核心数据创建的类 LoginPass.h 然后我有头等舱 FirstClass.h 然后我需要在 SecondClass 中使用这些类，我在其中使用 @class 声明它们。头文件 Se
c - 如何在运行时检测 SO_REUSEPORT 可用性？
例如 linux kernel-2.6.32-279 没有在/usr/include/asm-generic/socket.h 中定义 SO_REUSEPORT 但 kernel-2.6.32-431
linux - 检查 LVM 可用性
我正在尝试安装的工具说: MySQL server data directory needs to reside on an LVM volume 如何检查我的数据目录是否在 LVM 上？最佳答案
Android 检查设备上的 GPS 可用性
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: Programmatically find device support GPS or not? 如何检查设
security - 高可靠性/可用性/安全性的编码——我读什么标准？
我听说汽车行业有一种叫做 MISRA C 的东西。其他高可靠性/可用性/安全性行业的相关标准是什么，例如空间飞机银行/金融汽车医疗国防/军事？？？ -亚当最佳答案查看戈达德太空飞行

首页

博学

6Ren·AI

商城

python - 添加数据框并根据可用性划分结果