python - Pandas 变换方法执行缓慢-6ren

python - Pandas 变换方法执行缓慢

转载作者：行者123 更新时间：2023-12-04 15:20:36

24

4

我有一个规范的 Pandas transform性能似乎莫名其妙地缓慢的示例。我已阅读 Q&A on the apply method ，这是相关的，但在我看来，它为我的问题提供了一个不完整且可能具有误导性的答案，我将在下面解释。
我的数据框的前五行是

    id      date        xvar0   1004    1992-05-31  4.1516281   1004    1993-05-31  2.8680152   1004    1994-05-31  3.0432873   1004    1995-05-31  3.1895414   1004    1996-05-31  4.008760

There are 24,693 rows in the dataframe.
There are 2,992 unique id values.

I want to center xvar by id.

Approach 1 takes 861 ms:

df_r['xvar_center'] = (
    df_r
    .groupby('id')['xvar']
    .transform(lambda x: x - x.mean())
)

方法 2 需要 9 毫秒:

# Group means
df_r_mean = (
    df_r
    .groupby('id', as_index=False)['xvar']
    .mean()
    .rename(columns={'xvar':'xvar_avg'})
)

# Merge group means onto dataframe and center
df_w = (
    pd
    .merge(df_r, df_r_mean, on='id', how='left')
    .assign(xvar_center=lambda x: x.xvar - x.xvar_avg)
)

Q&A on the apply method建议尽可能依赖矢量化函数，就像@sammywemmy 的评论暗示的那样。我认为这是重叠的。然而， Q&A on the apply method还说:

"...here are some common situations where you will want to get rid of any calls to apply...Numeric Data"

@sammywemmy 的评论并没有“摆脱对 transform 的任何调用”方法在他们回答我的问题。相反，答案依赖于 transform方法。因此，除非@sammywemmy 的建议严格由不依赖于 transform 的替代方法主导。方法，我认为我的问题及其答案与 Q&A on the apply method 中的讨论完全不同。 . (感谢您的耐心和帮助。)

最佳答案

这个答案是由于@sammywemmy 的有见地的评论，他应该得到所有的信任，没有任何不准确之处。因为transform的类似用法在 Pandas User's Guide 中进行了说明，我认为详细说明可能对其他人有用。
我的假设是问题在于使用非矢量化函数和大量组的组合。当我更改 groupby来自 id 的变量(2,992 个唯一值)到 year (由 date 变量构建并包含 28 个唯一值)，我的原始方法与 @sammywemmy 的性能差异显着缩小，但仍然很显着。

%%timeit
df_r['xvar_center_y'] = (
    df_r
    .groupby('year')['xvar']
    .transform(lambda x: x - x.mean())
)
11.4 ms ± 202 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

对比

%timeit df_r['xvar_center_y'] = df_r.xvar - df_r.groupby('year')['xvar'].transform('mean')
1.69 ms ± 5.11 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

@sammywemmy 洞察力的美妙之处在于，它很容易应用于其他常见的转换，以实现潜在的显着性能改进，并且附加代码的成本适中。例如，考虑标准化一个变量:

%%timeit
df_r['xvar_z'] = (
    df_r
    .groupby('id')['xvar']
    .transform(lambda x: (x - x.mean()) / x.std())
)
1.34 s ± 38 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

对比

%%timeit 
df_r['xvar_z'] = (
    (df_r.xvar - df_r.groupby('id')['xvar'].transform('mean')) 
    / df_r.groupby('id')['xvar'].transform('std')
)
3.96 ms ± 297 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

关于python - Pandas 变换方法执行缓慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63406167/

24

4

0

文章推荐： elixir - Phoenix/Elixir/Ecto - unique_constraint 不适用于名称选项

文章推荐： c# - 如何在 WPF WebView2 中禁用 CORS

文章推荐： oauth-2.0 - AWS Cognito 的 token 自省(introspection)路径是什么

javascript - 变换 div 并移动滚动位置？ .scrollTop、.css 变换
我正在寻找一种简单的解决方案来将对象从一个地方移动和缩放到另一个地方。我做了一个JSfiddle用这个代码。问题是我需要它在某个时刻停止变小。所以它有一个最小尺寸，另一个问题是我希望它既缩小又向左移
css - 3D CSS 变换 - 变换 :rotateX(180deg);
我正在尝试通过沿 x 轴上下翻转(180 度)来为悬停时的图像设置动画。就像here 除非我出于某种原因无法让它工作。 img { transition:all 2s ease-in-out
math - 帮我解决刚体物理/变换
我想实例化一个 slider 约束，它允许 body 在 A 点和 B 点之间滑动。为了实例化约束，我指定了两个物体进行约束，在这种情况下，一个动态物体被约束到静态世界，比如滑动门。第三个和第四个
jQuery 旋转/变换
我想使用此功能旋转然后停止在特定点或角度。现在该元素只是旋转而不停止。代码如下: $(function() { var $elie = $("#bkgimg");
iphone - CATransform3D 变换
我正在尝试使用 CATransform3D 向 View 添加透视图。目前，这就是我得到的: 这就是我想要得到的: 我很难做到这一点。我完全迷失在这里。这是我的代码: CATransform3D t
java - 变换+缩放一组点
我编写了一个图形用户界面，用户可以在其中在 (640x480) 窗口中绘制内容。它使该绘图成为一组存储在 Vector 数组中的点。现在，我如何将这些点集平移到原点(0,0 窗口左上角)或将其放在指
html - 变换/缩放不适本地缩放固定的背景附件
我的应用程序中有两张图像相互叠加，分别表示为 foreground 和 background。对于这两个，我都使用 background-attachment: fixed 来确保图像始终彼此完全相同
html - 变换:旋转模糊图像
如何在不损失质量的情况下应用旋转变换？我试过添加 translateZ(0) 但它无济于事。这是例子: svg { background-color: rgb(93, 193, 93); }
css - 变换:尺度问题
我有一个 div，我试图在悬停时缩放它(只是 Y)。问题是它在没有过渡的情况下运行良好。当我使用过渡时，div 在顶部缩放一点然后下降，检查 fiddle 。问题是如何防止 div 那样缩放？我希望它
css - 变换:缩放裁剪
我正在尝试使用 transform: scale 图像网格 http://movies.themodern-nerd.com/genre .从左向右滚动时它工作正常，悬停的图像将停留在其他图像之上，但
CSS3 变换、倾斜和旋转
我正在查看 CSS3 Transform 并且想要一个既倾斜又旋转的盒子。我试过使用: transform:rotate(80deg); -moz-transform:rotate(80deg);
javascript - 变换 - 鼠标在父对象上移动时图像的原点
当用户在图像父元素上执行 mousemove 时，我试图在 img 上添加平滑移动效果(此处为 .carousel-img)但我无法正常运行它。我做错了什么？ $('.carousel-img').
javascript - 变换:缩放垂直对齐的元素
我有 div 元素在其他 div 元素中垂直对齐。我使用以下方法对齐它们:position: relative;变换:翻译Y(-50%)；顶部:50%。这很好用。我现在想缩放元素(使用 jQuer
CSS Matrix3D 变换
我在这个 fiddle 中使用 RotateX 后创建了 3D 效果: http://jsfiddle.net/vEWEL/11/ 但是，我不确定如何在这个 Fiddle 中的红色方 block 上实
image - 变换:缩放与传统调整大小
使用 transform: scale(x.x) 而不是使用 width 和 height 属性进行传统的调整大小有什么缺点吗？缩放会产生质量较低的图像或其他什么吗？最佳答案 Scale 生成总体上
c++ - OpenGL 变换
我在一个点上有一个对象，比如相对于原点的 x、y、z。我想对点应用一些变换，比如旋转和平移，并在变换后的点渲染对象。我正在使用 glTranslatef() 和 glRotatef() 函数。它看起
css - 变换 :before or :after item
有没有办法将转换应用到插入了 :before 的元素上？以下方法无效，但我愿意接受其他解决方案。 .itemclass:before { content: "➨"; transform:
调整元素大小的 CSS 变换
我找到了这个:width/height after transform 和其他几个，但没有什么不是我正在寻找的。我想要的是将某些东西缩放到其大小的 50%(当然还有漂亮的动画过渡)并让页面布局重新调整
javascript - 使用缓动曲线的 Css 变换
我想使用变换为元素位置设置动画。我怎么能在这个翻译中添加一些曲线(没什么特别的，只是不是一条完整的直线)？对于 jquery，我会使用效果很好的 easeInSine。 var a = documen
graphics - 变换 Direct3D 网格
我试着写一个 TransformMesh功能。该函数接受一个 Mesh对象和 Matrix目的。这个想法是使用矩阵来转换网格。为此，我锁定了顶点缓冲区，并在每个顶点上调用了 Vector3::Tran

首页

博学

6Ren·AI

商城

python - Pandas 变换方法执行缓慢