python - 给定未排序的其他约束，标准化数据框中的值-6ren

python - 给定未排序的其他约束，标准化数据框中的值

转载作者：行者123 更新时间：2023-12-01 03:17:24

我有一个如下所示的数据框:

            counter leg_rate pose_rate component    approach      rmse
0   proc/stat-stime        d         d      test    Baseline  1.583097
1   proc/stat-stime        d         r      test  AEW - MTEN  0.516108
2   proc/stat-stime        d         d      test        ASDF  0.705861
3   proc/stat-stime        r         r      test        ASDF  0.345816
4   proc/stat-utime        d         r      test    Baseline  1.128632
5   proc/stat-stime        d         r      test    Baseline  1.579803
6   proc/stat-stime        r         r      test    Baseline  1.345895
7   proc/stat-utime        r         r      test  AEW - MTEN  0.187236
8   proc/stat-utime        d         d      test    Baseline  1.193776
9   proc/stat-stime        r         d      test        ASDF  0.014975
10  proc/stat-utime        r         r      test        ASDF  0.985493
11  proc/stat-utime        r         d      test  AEW - MTEN  0.897336
12  proc/stat-stime        r         d      test    Baseline  1.415103
13  proc/stat-utime        r         d      test    Baseline  1.724266
14  proc/stat-utime        r         r      test    Baseline  1.294654
15  proc/stat-utime        d         d      test  AEW - MTEN  0.263845
16  proc/stat-utime        r         d      test        ASDF  0.497368
17  proc/stat-stime        d         d      test  AEW - MTEN  0.143402
18  proc/stat-utime        d         r      test  AEW - MTEN  0.233437
19  proc/stat-stime        r         d      test  AEW - MTEN  0.431739
20  proc/stat-utime        d         r      test        ASDF  0.002475
21  proc/stat-stime        d         r      test        ASDF  0.331700
22  proc/stat-stime        r         r      test  AEW - MTEN  0.985123
23  proc/stat-utime        d         d      test        ASDF  0.464989

我想通过将 rmse 除以名为 Baseline 的方法中的值来标准化它。最后应该有一个新列 rmse-norm ，其中包含相应的标准化值。所有其他列基本上都提供了划分 rmse 时需要匹配的上下文。这意味着该行

1   proc/stat-stime        d         r      test  AEW - MTEN  0.516108

需要除以与其他列匹配的行

5   proc/stat-stime        d         r      test    Baseline  1.579803

Baseline 方法中总会有一个匹配的行。

我已经尝试使用 groupby 并使用其他列的索引进行各种操作，但由于列的顺序未知，我无法想出一些简洁的方法来为正确的值分配正确的值订购。

最佳答案

我认为你可以使用:

#filter all rows with Baseline to `MultiIndex` `Series`
cols = ['counter','leg_rate','pose_rate','component']
s = df[df.approach == 'Baseline'].set_index(cols)['rmse']
print (s)
counter          leg_rate  pose_rate  component
proc/stat-stime  d         d          test         1.583097
proc/stat-utime  d         r          test         1.128632
proc/stat-stime  d         r          test         1.579803
                 r         r          test         1.345895
proc/stat-utime  d         d          test         1.193776
proc/stat-stime  r         d          test         1.415103
proc/stat-utime  r         d          test         1.724266
                           r          test         1.294654
Name: rmse, dtype: float64

#sorting for matching, because set_index sort index
df = df.sort_values(cols)
#divide by s, output to numpy array for assign to rmse column
df['rmse'] = df.set_index(cols)['rmse'].div(s).values
#sort index to original unsorted df
print (df.sort_index())
            counter leg_rate pose_rate component    approach      rmse
0   proc/stat-stime        d         d      test    Baseline  1.000000
1   proc/stat-stime        d         r      test  AEW - MTEN  0.326691
2   proc/stat-stime        d         d      test        ASDF  0.445873
3   proc/stat-stime        r         r      test        ASDF  0.256941
4   proc/stat-utime        d         r      test    Baseline  1.000000
5   proc/stat-stime        d         r      test    Baseline  1.000000
6   proc/stat-stime        r         r      test    Baseline  1.000000
7   proc/stat-utime        r         r      test  AEW - MTEN  0.144622
8   proc/stat-utime        d         d      test    Baseline  1.000000
9   proc/stat-stime        r         d      test        ASDF  0.010582
10  proc/stat-utime        r         r      test        ASDF  0.761202
11  proc/stat-utime        r         d      test  AEW - MTEN  0.520416
12  proc/stat-stime        r         d      test    Baseline  1.000000
13  proc/stat-utime        r         d      test    Baseline  1.000000
14  proc/stat-utime        r         r      test    Baseline  1.000000
15  proc/stat-utime        d         d      test  AEW - MTEN  0.221017
16  proc/stat-utime        r         d      test        ASDF  0.288452
17  proc/stat-stime        d         d      test  AEW - MTEN  0.090583
18  proc/stat-utime        d         r      test  AEW - MTEN  0.206832
19  proc/stat-stime        r         d      test  AEW - MTEN  0.305094
20  proc/stat-utime        d         r      test        ASDF  0.002193
21  proc/stat-stime        d         r      test        ASDF  0.209963
22  proc/stat-stime        r         r      test  AEW - MTEN  0.731946
23  proc/stat-utime        d         d      test        ASDF  0.389511

使用groupby和自定义函数f的另一个解决方案:

def f(x):
    x.rmse = x['rmse'] / x.loc[x['approach'] == 'Baseline', 'rmse'].item()
    return x

df = df.groupby(['counter','leg_rate','pose_rate','component']).apply(f)
print (df)
            counter leg_rate pose_rate component    approach      rmse
0   proc/stat-stime        d         d      test    Baseline  1.000000
1   proc/stat-stime        d         r      test  AEW - MTEN  0.326691
2   proc/stat-stime        d         d      test        ASDF  0.445873
3   proc/stat-stime        r         r      test        ASDF  0.256941
4   proc/stat-utime        d         r      test    Baseline  1.000000
5   proc/stat-stime        d         r      test    Baseline  1.000000
6   proc/stat-stime        r         r      test    Baseline  1.000000
7   proc/stat-utime        r         r      test  AEW - MTEN  0.144622
8   proc/stat-utime        d         d      test    Baseline  1.000000
9   proc/stat-stime        r         d      test        ASDF  0.010582
10  proc/stat-utime        r         r      test        ASDF  0.761202
11  proc/stat-utime        r         d      test  AEW - MTEN  0.520416
12  proc/stat-stime        r         d      test    Baseline  1.000000
13  proc/stat-utime        r         d      test    Baseline  1.000000
14  proc/stat-utime        r         r      test    Baseline  1.000000
15  proc/stat-utime        d         d      test  AEW - MTEN  0.221017
16  proc/stat-utime        r         d      test        ASDF  0.288452
17  proc/stat-stime        d         d      test  AEW - MTEN  0.090583
18  proc/stat-utime        d         r      test  AEW - MTEN  0.206832
19  proc/stat-stime        r         d      test  AEW - MTEN  0.305094
20  proc/stat-utime        d         r      test        ASDF  0.002193
21  proc/stat-stime        d         r      test        ASDF  0.209963
22  proc/stat-stime        r         r      test  AEW - MTEN  0.731946
23  proc/stat-utime        d         d      test        ASDF  0.389511

关于python - 给定未排序的其他约束，标准化数据框中的值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42341278/

文章推荐： python - 如何使用 matplotlib 绘制一维高斯混合模型的 pdf

文章推荐： jquery - datatables.net 在行单击时获取行数据

文章推荐： python - 元组错误数组格式

perl - 给定/当值未定义时
在下面的代码中，我得到一个 uninitialized value警告，但仅限于第二个 given/when例子。为什么是这样？ #!/usr/bin/env perl use warnings; u
perl - 给定/何时的哪些部分是实验性的？
整个“开关”功能是否已成为实验性的？在没有 Perl 的 future 版本破坏我的代码的情况下，我可以依赖其中的某些部分吗？一般来说，将稳定功能更改为实验性的政策是什么？背景use feature
c++ - 条件语句(给定)
有没有办法在一个条件语句中写出如下语句？ a和b不能同时等于5。 (a可以是5，b可以是5，但是a AND b不能是5) 最佳答案正如克里斯指出的那样，您要查找的是逻辑异或，相当于逻辑不等于 !=:
给定 n 条线查找所有线段交点的算法
我正在寻找一种算法来找到给定 n 条线段的所有交点。以下是来自 http://jeffe.cs.illinois.edu/teaching/373/notes/x06-sweepline.pdf 的伪
python - 给定 k 个标记的最大项目
数组中有 N 个元素。我可以选择第一项最多 N 次，第二项最多选择 N-1 次，依此类推。我有 K 个 token 要使用并且需要使用它们以便我可以拥有最大数量的项目。 arr = [3, 4, 8
python - 给定 Spacy 中的引理是否有可能获得单词列表？
我正在尝试修复法语文本中的语法性别，想知道是否有办法从某个词条中获取所有单词的列表，以及是否可以在此类列表中进行查找？最佳答案尝试: import spacy lemma_lookup = spa
winapi - 给定 HWND，如何从所有者绘制的窗口中提取文本信息？
我正在为 Win32 编写一个简单的自动化测试应用程序。它作为一个单独的进程运行，并通过 Windows API 访问目标应用程序。我可以阅读窗口层次结构，查找标签和文本框，并通过发送/发布消息等来单
javascript - 给定 JSON 中的第一行是什么？
在 nodeJs 中使用 Sequelize 时，我从 Sequelize 收到此错误，如下所示: { [SequelizeUniqueConstraintError: Validation erro
python - 给定 CNN 的回归激活映射
本文https://arxiv.org/pdf/1703.10757.pdf使用回归激活映射 (RAM) - 而不是类激活映射 (CAM) 来解决问题。有几篇文章描述了如何实现 CAM。但是我找不到
ios - 给定 mach_header 我如何找到二进制图像名称？
我正在研究 Mach 动态链接器 dyld。这个问题适用于所有 Apple 平台，但很高兴得到特定于平台的答案；我正在使用 ObjC，但如果对你有用的话，我也很乐意翻译 Swift。 The rele
instagram - 给定 user_id，如何找到用户名？
我有一个包含数千个 Instagram 用户 ID 的列表。我如何获得他们的 Instagram 用户名/句柄？最佳答案你必须使用这个 Instagram API: https://api.ins
scala - 给定 Elasticsearch 无效模式
我在下面的代码: def main(args: Array[String]) { val sparkConf = new SparkConf().setAppName("Spark-Hbase").s
excel - 给定 2 个日期时查找单元格范围
我有一个表格，其中包含从 1 到 10 的数字。(从 D2 到 M2) 假设A1中有03/09/2019 并且在B1中有06/09/2019 并且在C1中有Hello 在A 列中，我有多个系列的单词，
java - 给定 URI 的注释检索
我想在给定服务对应的 URI 的情况下检索服务的注释(特别是 @RolesAllowed )。这是一个例子: 服务: @GET @Path("/example") @RolesAllowed({ "B
oracle - 给定 JDBC 连接上的并发查询？
我看到 OraclePreparedStatementexecuteQuery() 表现出序列化。也就是说，我想使用相同的连接对 Oracle 数据库同时运行两个查询。然而，OraclePrepare
java - 给定 k，使用递归求几何和
import java.util.Scanner; public class GeometricSumFromK { public static int geometricSum(int k,
java - 给定 HttpServletRequest 的网页服务的良好模式是什么？
我创建了一个抽象基类Page，它说明了如何构建动态网页。我正在尝试想出一种基于作为 HttpServletRequest 传入的 GET 请求生成 Page 的好方法。例如... public cla
java - 给定 SMS 字符串的正则表达式是什么
我的字符串是一条短信，采用以下两种格式之一: 潜在客户短信: 您已收到 1 条线索标题:我的领导潜在客户 ID:12345-2365 警报设置 ID:890 短信回复: 您已收到 1 条回复标题
python - 给定 python 中的字符串列表
我在 python 中有以下代码: class CreateMap: def changeme(listOne, lisrTwo, listThree, listFour, listfive):
java - 给定 id 的多个实体的高效缓存感知获取
这是在 Hibernate 上运行的 JPA2。我想检索相同实体类型的多个实例，给定它们的 ID。其中许多已经在持久性上下文和/或二级缓存中。我尝试了几种方法，但似乎都有其缺点: 当我使用 ent

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 给定未排序的其他约束，标准化数据框中的值