python - 缺少数据的 pandas groupby 操作-6ren

python - 缺少数据的 pandas groupby 操作

转载作者：太空狗更新时间：2023-10-30 01:32:23

26

4

在 Pandas 数据框中，我有一列看起来像:

0         M
1         E
2         L
3       M.1
4       M.2
5       M.3
6       E.1
7       E.2
8       E.3
9       E.4
10      L.1
11      L.2
12    M.1.a
13    M.1.b
14    M.1.c
15    M.2.a
16    M.3.a
17    E.1.a
18    E.1.b
19    E.1.c
20    E.2.a
21    E.3.a
22    E.3.b
23    E.4.a

我需要对第一个元素为 E、M 或 L 的所有值进行分组，然后，对于每个组，我需要创建一个索引为 1 的子组， 2 或 3，每个 小写字母 (a,b,c, ...) 都包含一条记录潜在的解决方案应该适用于任意数量的级别连接元素(在这种情况下，级别数为 3(例如:A.1.a))

0    1    2
E    1    a
          b
          c
     2    a
     3    a
          b
     4    a
L    1
     2
M    1    a
          b
          c
     2    a
     3    a

我试过:

df.groupby([0,1,2]).count()

但结果缺少L层，因为它没有最后一个子层的记录

解决方法是添加一个虚拟变量，然后将其删除……例如:

df[2][(df[0]=='L') & (df[2].isnull()) & (df[1].notnull())]='x'
df = df.replace(np.nan,' ', regex=True)
df.sort_values(0, ascending=False, inplace=True)
newdf = df.groupby([0,1,2]).count()

给出:

0    1    2
E    1    a
          b
          c
     2    a
     3    a
          b
     4    a
L    1    x
     2    x
M    1    a
          b
          c
     2    a
     3    a

然后我稍后在我的代码中处理 dummy 条目 x ...

如何避免这种使用 groupby 的笨拙方式？

最佳答案

假设所考虑的列由 s 表示，我们可以:

拆分 "." 分隔符和 expand=True 以生成扩展的 DF。
<
fnc :检查分组框架的所有元素是否仅包含None，然后用虚拟条目替换它们 "" 是通过list-comprehension 建立的。稍后在过滤列表上调用系列构造函数。随后使用 dropna 删除此处出现的任何 None。
执行 groupby w.r.t. 0 和 1 列名称并将 fnc 应用于 2。

split_str = s.str.split(".", expand=True)
fnc = lambda g: pd.Series(["" if all(x is None for x in g) else x for x in g]).dropna()
split_str.groupby([0, 1])[2].apply(fnc)

产生:

0  1   
E  1  1    a
      2    b
      3    c
   2  1    a
   3  1    a
      2    b
   4  1    a
L  1  0    
   2  0    
M  1  1    a
      2    b
      3    c
   2  1    a
   3  1    a
Name: 2, dtype: object

要获得扁平化的DF，请将索引重置为与之前用于对DF 进行分组的级别相同的索引:

split_str.groupby([0, 1])[2].apply(fnc).reset_index(level=[0, 1]).reset_index(drop=True)

产生:

    0  1  2
0   E  1  a
1   E  1  b
2   E  1  c
3   E  2  a
4   E  3  a
5   E  3  b
6   E  4  a
7   L  1   
8   L  2   
9   M  1  a
10  M  1  b
11  M  1  c
12  M  2  a
13  M  3  a

关于python - 缺少数据的 pandas groupby 操作，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42195515/

26

4

0

文章推荐： python - 配置 Kivy > y 轴的反转输入

文章推荐： c# - 如何设置数据报文中不同段的十六进制输入范围？

文章推荐： c# - 来自 C# 代码的 SQL Lead 和 Lag 函数

文章推荐： python - 如何从数据框中弹出行？

r - Leaflet R derivePolygons 缺少 lat 缺少 long
我正在尝试在 map 上绘制一些疾病事件数据的位置。我用它来导入数据: ByTown% addProviderTiles("CartoDB.Positron")%>% addPolygons
javascript - 缺少 ) 在使用异步等待的参数列表之后
我有一个文件调用 find.js，我使用 node find.js 运行，我的节点是版本 10 我不知道为什么我无法使用 async await。 const axios = require("axi
.net - 缺少 HttpContext
我有一个项目作为引用添加到 System.Web。但是，它似乎无法获取 HttpContext。这样做: Imports System.Web _ApplicationBase = HttpCont
java - 缺少 While 循环逻辑
在互联网上找到这段代码，出于某种原因它缺少 while 循环逻辑“while(i....)”，虽然我找到了 PigLatin* 问题的其他可行解决方案，但我真的很想了解这个正在工作。 *PigLati
缺少 TYPO3 管理后端模块
我工作了一整天来运行 Xampp 并在其上安装 TYPO3。现在我登录到后端，但没有显示许多管理模块，例如模板、访问等。 - 一定是我做错了什么，但我不知道。 these are the module
latex - 缺少 $ 插入
你好我有编译这个问题 \begin{equation} J = \sum_{j=1}^{C} \end{equation} 我不断收到错误 missing $ inserted 这很奇怪，因
缺少 SQLite generate_series
我正在尝试使用 SQLite CLI，但无法获得 generate_series功能来工作。我可以按照文档中的建议使用递归 CTE 对其进行模拟，但我似乎无法获得该链接中的任何示例。这是我的 sess
缺少 .NET 运行时优化服务
我目前正在开发我想要的软件，而软件正在安装，它可以在后台为软件创建 native 图像。我正在考虑使用 NGEN 并将进程优先级设置为低，因为我不希望它消耗 100% CPU。但是我发现我的计算机上
缺少 XCode 仪器自动化
我想使用 Xcodes Instruments 进行 UI 自动化测试。但似乎缺少“自动化”。我怎样才能添加这个？最佳答案如果您想使用自动化仪器，请使用 Xcode 7.3。 Apple 在 Xc
javascript - 缺少创建逻辑
我目前在 JS 开发中迈出了一小步，并编写了以下链接添加器: const button = document.getElementById('button') const listdiv = docu
ios - 缺少[在开始消息中发送表达式
此代码有什么问题: NSError *error = nil; [SFHFKeychainUtils deleteItemForUsername:@"IAPNoob01" andServiceName
flash - 缺少 AGALMiniAssembler
出于某种原因，在安装和配置(我认为)一切之后，com.adobe.utils.AGALMiniAssembler 不见了，其他一切正常。我认为我已尽一切努力让孵化器正常工作，但显然我错过了一步。如
缺少 Perl 参数
我有一个名为 new 的方法。调用 new 时，我传递了一个参数，但是当我运行应用程序时，出现没有参数或参数为空的错误。 StepReader.pm package StepReader; use s
c - 缺少 locale_t
安装 gtk 1.2(包名 gtk1)和 macports chokes 在最终的 make 中，在 libintl.h 的第 440 行。 extern locale_t libintl_newlo
javascript - 为什么我在动态生成按钮时在参数列表后出现错误 - 缺少 )？
我用按钮创建表格。这是javascript代码: function layersListTable(layers) { var content =''; $.each($(layer
javascript 缺少 ) 参数
我在使用此 javascript 时遇到此错误，任何人都可以帮我弄清楚我做错了什么吗？ $(this).prepend('Check availability »'); 它给我错误 mis
android - 缺少 sync_val_compare_and_swap_1
我有一个独立的工具链 NDK13b、api19、llvm 3.8 编译器、arm 32 位、带有 libcpp(llvm C++ 库) 我想避免依赖 libgcc，所以我构建了 compiler-rt
缺少 AndroidManifest 文件
我按照一些教程使用 phonegap 的条形码扫描器插件。但是当我从现有源创建一个新的 android 项目来创建条码库时 (step 6 in this page)我收到错误:“AndroidMan
缺少 Android 布局编辑器
我现在尝试在 Eclipse 中打开我的布局 xml 文件。我只得到错误 No XML content. Please add a root view or layout to your docume
缺少 Android 层次结构查看器
我的 android-sdk-windows\tools 目录中缺少层次结构查看器工具。工具链接: http://developer.android.com/guide/developing/too

首页

博学

6Ren·AI

商城

python - 缺少数据的 pandas groupby 操作