- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在使用一个具有多个实验室值的患者数据库,其中每个实验室都有自己的行,即使是在同一日期。我想根据每个患者的重复日期折叠行,以便每个日期一行包含当天所有实验室的结果。
我尝试了各种 groupby()
和 pd.merge()
函数,但均无济于事。
玩具示例:
import pandas as pd
import numpy as np
PID = [1, 1, 1, 2, 2, 2]
ALC = [200, np.nan, np.nan, 300, np.nan, np.nan]
WBC = [np.nan, 1000, np.nan, np.nan, 2000, np.nan]
per_neut = [np.nan, np.nan, 0.64, np.nan, np.nan, 0.77]
date = ['11/1/18', '11/2/18', '11/2/18', '1/11/04',
'1/11/04','1/11/04']
prac_dict = {'PID':PID, 'date':date, 'ALC':ALC, 'WBC':WBC,
'per_neut':per_neut}
pract_df = pd.DataFrame(prac_dict)
这就是我所拥有的
print(pract_df)
PID date ALC WBC per_neut
0 1 11/1/18 200.0 NaN NaN
1 1 11/2/18 NaN 1000.0 NaN
2 1 11/2/18 NaN NaN 0.64
3 2 1/11/04 300.0 NaN NaN
4 2 1/11/04 NaN 2000.0 NaN
5 2 1/11/04 NaN NaN 0.77
这就是我想要的:
PID date ALC WBC per_neut
0 1 11/1/18 200.0 NaN NaN
1 1 11/2/18 NaN 1000.0 0.64
2 2 1/11/04 300.0 2000.0 0.77
非常欢迎提出建议!
最佳答案
如果需要每组每列的第一个非缺失值,请使用 GroupBy.first
:
df = pract_df.groupby(['PID','date'], as_index=False).first()
print (df)
PID date ALC WBC per_neut
0 1 11/1/18 200.0 NaN NaN
1 1 11/2/18 NaN 1000.0 0.64
2 2 1/11/04 300.0 2000.0 0.77
但是,如果每个组有重复值,例如 ALC
列最后一组中的 50
,则需要指定聚合函数,例如 sum
、意思
,如果使用第一个
第二个值会丢失:
PID = [1, 1, 1, 2, 2, 2]
ALC = [200, np.nan, np.nan, 300, np.nan, 50]
WBC = [np.nan, 1000, np.nan, np.nan, 2000, np.nan]
per_neut = [np.nan, np.nan, 0.64, np.nan, np.nan, 0.77]
date = ['11/1/18', '11/2/18', '11/2/18', '1/11/04',
'1/11/04','1/11/04']
prac_dict = {'PID':PID, 'date':date, 'ALC':ALC, 'WBC':WBC,
'per_neut':per_neut}
pract_df = pd.DataFrame(prac_dict)
print (pract_df)
PID date ALC WBC per_neut
0 1 11/1/18 200.0 NaN NaN
1 1 11/2/18 NaN 1000.0 NaN
2 1 11/2/18 NaN NaN 0.64
3 2 1/11/04 300.0 NaN NaN
4 2 1/11/04 NaN 2000.0 NaN
5 2 1/11/04 50.0 NaN 0.77
<小时/>
df1 = pract_df.groupby(['PID','date'], as_index=False).sum(min_count=1)
print (df1)
PID date ALC WBC per_neut
0 1 11/1/18 200.0 NaN NaN
1 1 11/2/18 NaN 1000.0 0.64
2 2 1/11/04 350.0 2000.0 0.77
df2 = pract_df.groupby(['PID','date'], as_index=False).mean()
print (df2)
PID date ALC WBC per_neut
0 1 11/1/18 200.0 NaN NaN
1 1 11/2/18 NaN 1000.0 0.64
2 2 1/11/04 175.0 2000.0 0.77
df3 = pract_df.groupby(['PID','date'], as_index=False).first()
print (df3)
PID date ALC WBC per_neut
0 1 11/1/18 200.0 NaN NaN
1 1 11/2/18 NaN 1000.0 0.64
2 2 1/11/04 300.0 2000.0 0.77
关于python - 根据列的重复值折叠数据框并删除 NaN 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56302656/
我需要能够在我的 javascript 中折叠/折叠各种代码片段,有点像 C# 中的#region #endregion。我找不到执行此操作的方法,有什么帮助吗? 最佳答案 窗口菜单 -> 选择首选项
折叠 Accordion 时,我注意到在这段时间内没有显示边框。例如,当 Accordion 展开时,我们会在展开时看到边界。这也可以在折叠 Accordion 时完成吗? Accordion 折叠时
是否有任何插件或快捷方式可以隐藏 Sublime Text 2 中除代码部分之外的所有内容? 我需要一次折叠除部分之外的所有部分,而不是一次折叠一个部分。 谢谢~ 最佳答案 如果将鼠标悬停在行号上,您
在 Web 应用程序中,我有一个操作可能会以各种不同的方式失败,或者最终会成功。 在这种情况下,成功和失败由 SimpleResult 的子类表示(表示 HTTP 响应) 我使用 scalaz/上的
我的数据在这样的分组方案中分为三个连续的类别: 因此,整个“OCM”组被分解为名为“N/A”、“Financials”、“Industrials”等的子组,每个子组又被分解为进一步的子组。 我在 Ex
我正在尝试猫图书馆,但我很难在我应该导入和创建的东西之间导航。我的问题如下: sealed trait Checks case class CheckViolation(id: Long, msg:
有没有办法查看当前文件中打开的折叠位置? 我个人在打开折叠和移动时遇到问题,我无法找到折叠开始的线!也许有一个选项可以在数字旁边设置一个漂亮的折叠提示。也许是这样的: + 1 void myfunc(
我正在寻找一种按空白深度折叠纯文本的方法。我更喜欢 Notepad++ 解决方案,但如果它只能在另一个编辑器中完成,我可以处理。例如 Header is arbitrary text Child i
今天早上我遇到了优秀的 jstree jQuery UI 插件。一句话——太棒了!它易于使用,易于样式化,并且可以按照包装盒上的说明进行操作。我还没有弄清楚的一件事是 - 在我的应用程序中,我想确
我有以下XAML,其中堆叠了三个组框。这些组框的标题中是复选框。 我想要实现的是:当我选中/取消选中一个框时,我希望相应的groupbox能够以平滑的动画缓慢展开/折叠。 我正在Blend 4中尝试此
我知道如何使用 zO 打开光标下的所有折叠. 但是反向怎么做呢? 我想要类似 za 的东西确实如此,但也具有递归性。 附注。我知道有 zC ,但它会关闭与当前行相关的所有父级折叠,我想关闭子级。 最佳
我试图防止点击 About Us 时导航栏崩溃部分或 Projects以下代码中的部分。我已经尝试过event.stopPropagation()在这两个按钮上,但是当 jQuery 代码执行时,导航
我有一个DataGrid。它具有DataGrid.RowDetailsTemplate。当单击一个按钮时,它应该展开/折叠;我该怎么做?
我有一个 Storyboard动画,使用Opacity属性可以使控件淡出 View 。完成后,我想将控件的“可见性”设置为“折叠”。 我也想做相反的事情...将“可见性”设置为“可见”,然后使用 St
我将 SublimeText3 用于 C++ 和 Java。我想知道是否有办法折叠文件/类中的所有方法,然后将它们全部展开,而不管插入符号在哪里。或者有没有办法列出所有的功能/方法。 基本上我希望能够
如何在 YAML 中断开长字符串(如长 url 或文件名/路径),而不会将换行符变成空格? 示例输入: url: > https://example.com/?what=Lorem %20ip
给定: import shapeless._ case class F(x: Option[Int], y: Option[Int]) 我想帮忙写一个函数,f: def f(Option[Int]::
我想测试数组是否仅包含唯一元素,我的解决方案如下: function uniqueElements(a) { var r = true; while (a) { var [el, a]
我试图在单击“项目”按钮时使“javascript 项目”和“CGI 项目”滑动切换。但是,我不太明白为什么点击时只有CGI项目按钮切换,而javascript项目按钮保持不变? 我正在尝试使用 Jq
我有一组需要在 UI 中显示的项目,例如标题和其下的项目列表。 有一个父组件,我将在其中将此数据传递到如下所示的文件. 在此基础上显示了父子布局。 现在我需要根据标题的点击展开/折叠。 有一个可以附加
我是一名优秀的程序员,十分优秀!