python - 如何应用独特的函数并转换并保留数据框 pandas 中的完整列-6ren

python - 如何应用独特的函数并转换并保留数据框 pandas 中的完整列

转载作者：行者123 更新时间：2023-11-30 09:33:05

24

4

我的目标是提取数据框中 for each PatienNumber and year and month 的行数显示它们的计数并将所有列保留在数据框中。

这是原始数据框:

 PatientNumber           QT         Answer   Answerdate      year    month  dayofyear  count  formula
1        1          transferring     No      2017-03-03      2017       3         62      2.0   (1/3)
2        1          preparing food   No      2017-03-03      2017       3         62      2.0   (1/3)
3        1          medications      Yes     2017-03-03      2017       3         62      1.0   (1/3)
4        2          transferring     No      2006-10-05      2006       10        275    3.0    0   
5        2          preparing food   No      2006-10-05      2006       10        275    3.0    0
6        2          medications      No      2006-10-05      2006       10        275    3.0    0
7        2          transferring     Yes     2007-4-15       2007       4        105    2.0    2/3
8        2          preparing food   Yes     2007-4-15       2007       4        105    2.0   2/3
9        2          medications      No      2007-4-15       2007       4        105    1.0      2/3
10       2          transferring     Yes     2007-12-15      2007       12        345    1.0      1/3
11       2          preparing food   No      2007-12-15      2007       12       345    2.0    1/3
12       2          medications      No      2007-12-15      2007       12        345    2.0    1/3
13       2          transferring     Yes     2008-10-10      2008       10        280    1.0    (1/3)
14       2          preparing food   No      2008-10-10      2008       10        280    2.0    (1/3)
15       2          medications      No      2008-10-10      2008       10        280    2.0    (1/3)
16       3          medications      No      2008-10-10      2008       12        280    ……    ………..

因此所需的输出应与此相同，多一列，显示 [患者编号，年份，月份] 的唯一行。对于 patient number=1 shows 1对于PatientNumber= 2 shows 1 in year 2006, shows 2 in year 2007

我应用了此代码:

data=data.groupby(['Clinic Number','year'])["month"].nunique().reset_index(name='counts')

此代码的输出如下所示:

  Clinic Number  year  **counts**
0        494383  1999       1
1        494383  2000       2
2        494383  2001       1
3        494383  2002       1
4        494383  2003       1

输出计数是正确的，但它不保留整个字段。我想要完整的列，因为稍后我必须对它们进行一些计算。

然后我尝试了这段代码:

data['counts'] = data.groupby(['Clinic Number','year','month'])['month'].transform('count')

这又不好，因为它没有显示正确的计数。这段代码的输出如下:

  Clinic Number Question Text Answer Text  ...    year month counts
1       3529933       bathing          No  ...    2011     1     10
2       3529933      dressing          No  ...    2011     1     10
3       3529933       feeding          No  ...    2011     1     10
4       3529933  housekeeping          No  ...    2011     1     10
5       3529933   medications          No  ...    2011     1     10

这里的计数应该是 1因为对于那个病人和那一年来说只有一个月。

最佳答案

使用，对您的代码进行以下修改。

df['counts'] = df.groupby(['PatientNumber','year'])["month"].transform('nunique')

transform 返回与原始数据帧长度相等的系列，因此您可以将此系列作为列添加到数据帧中。

关于python - 如何应用独特的函数并转换并保留数据框 pandas 中的完整列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50843296/

24

4

0

文章推荐： python - 字符串列表转换为浮点Python

文章推荐： javascript - 根据属性值对对象进行排序

文章推荐： python - 梯度增强分类器中训练数据的准确性 - scikit

prometheus - 哪些用例真正使普罗米修斯的汇总指标类型成为必要/独特？
对于 Prometheus 指标集合，如标题，我真的找不到只能通过 type Summary 完成的用例。，似乎它们都可以通过 type Histogram 以某种方式完成还。让我们以请求并发度量
r - 不区分大小写独特保持原样
这个问题在这里已经有了答案: Ignore case while using duplicated (1 个回答) 关闭 9 个月前。使用不区分大小写的 unique(tolower(x)) 删除
azure - 如何收到新(独特)错误的警报
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次，要么最多每次 X 次(一天或一周等)。例如，这可以通过 Visual
azure - 如何收到新(独特)错误的警报
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次，要么最多每次 X 次(一天或一周等)。例如，这可以通过 Visual
group-by - DB2 独特 + xmlagg 查询
我想要相当于 DB2 中 MySql 的 GROUP_CONCAT 功能。我尝试过 DB2 的 XML Aggrigate 函数来合并 murows。 SELECT a.ID, sub
python - 雪花和 SQLAlchemy "unexpected ' 独特'
我正在运行 python 数据库迁移脚本 (Flask-Migrate) 并添加了 alembic.ddl.imp import DefaultImpl 来解决第一组错误，但现在我收到以下错误。我正在
bash - 排序 |独特 | xargs grep ... 其中行包含空格
我有一个逗号分隔的文件“myfile.csv”，其中第 5 列是日期/时间戳。 (mm/dd/yyyy hh:mm)。我需要列出所有包含重复日期的行(有很多) 我正在通过 cygwin 为 WinX
MySQL 5.7 | MySQL 5.7分组依据 |独特|聚合错误
我使用的是 MySQL 5.7。我有一个表格如下: -------------------------------------------------- | id | currentcy_id |
javascript - ng-repeat 中的 Angular 独特 ng-model
所以我有一个像这样的 ng-repeat: Join Ride /md-switch> 但是，每个 md-switch 都有相同的模型，因此当我在 Control
node.js - Mongoose 独特 :true pre-save hook calls hook before validation
据我了解， Mongoose 预保存 Hook 在将文档插入集合之前但在验证发生之后触发。因此，如果一次验证失败，则不会调用预保存 Hook 。就我而言，无论如何都会调用它们: 下面的简单代码的作用
awk - 重现 grep "my pattern"myfile.log |排序 |独特 | awk 中的 wc -l
如果我对我的目标文件执行此 grep，我会得到例如 275 作为结果。但是我想学习 awk，所以在 awk 中尝试了这个: awk 'BEGIN { count=0 } /my pattern/

首页

博学

6Ren·AI

商城

python - 如何应用独特的函数并转换并保留数据框 pandas 中的完整列