python - 扩展分组表格数据的高效算法-6ren

python - 扩展分组表格数据的高效算法

转载作者：太空宇宙更新时间：2023-11-03 12:59:31

27

4

我正在寻找 python 中的优化工具来执行我发现自己一遍又一遍地执行的数组操作任务。如果该工具已经存在，例如在 numpy 或 pandas 中，我宁愿实现它，而不是继续使用我自己的 cythonized for 循环。

我有两个长度相同的数组，A 和 B，存储一些关于分组数据的数据。数组 A 的第 i 个条目告诉我组 i 的一些属性；数组 B 的第 j 个条目告诉我组 j 中有多少成员； A 存储 float ，B 存储整数。因此，为了确定性，如果 A[5]=100.4 & B[5]=7，则第 5 组的质量等于 100.4，并且该组有 7 个成员。

我的目标是创建一个新的 float 数组 C，长度为 B.sum()，它是上述数据集的扩展。所以 C[0:B[0]] = A[0]，C[B[0]:B[1]] = A[1]，等等。在 pandas 等现有库中是否有优化的解决方案来执行此操作？

我现有的解决方案是初始化一个空数组 C，然后在 A 的元素上运行 for 循环，如上所述索引 C 的公共(public)元素。为了速度，我一直在用 cython 编写和编译 for 循环。但是这个特定的操作是我的代码中最大的瓶颈，它似乎是处理表格数据时非常常见的数组操作，所以我想知道是否已经有一个高度优化的算法可以做到这一点。

最佳答案

Numpy 有 repeat() 用于那种类型的东西。

给定两个数组

A = np.array([100.4,98.3,88.5])
B = np.array([7,3,10])
np.repeat(A,B)

给你

array([ 100.4,  100.4,  100.4,  100.4,  100.4,  100.4,  100.4,   98.3,
         98.3,   98.3,   88.5,   88.5,   88.5,   88.5,   88.5,   88.5,
         88.5,   88.5,   88.5,   88.5])

关于python - 扩展分组表格数据的高效算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27621602/

27

4

0

文章推荐： java - Ant 公然忽略 JAVA_HOME 环境变量

文章推荐： python - 按属性聚合对象数组

必须加载 PHP 扩展 "curl"。必须加载 PHP 扩展 "soap"
我是 magento 的新手，目前我在 magento 安装期间遇到“必须加载 PHP 扩展 curl ”错误。你能帮帮我吗？最佳答案如果您的服务器上没有安装 curl，您可以键入以下命令之一来安
php - $ Composer 找不到 mongodb 扩展，需要 Mongodb 扩展
我在 macOS Mojave/macOS Big Sur/macOS Monterey/macOS Ventura 上使用最新的 php 版本 7.2 并收到类似错误 $composer requ
java - Integer 扩展 Number 但无法对
这个问题已经有答案了: Why generic type is not applicable for argument extends super class for both? (5 个回答) 已关
javascript - 在默认 NightWatch 浏览器实例中启用和修改 Chome 扩展(特别是 ModHeader 扩展)
我正在使用 NightWatch.js 并进行一些 UI 测试，我想用一些额外的 desiredCapabilities 启动默认浏览器实例(即启用扩展并应用一些特定值)。 p> 注意:我可以执行这些
java - 扩展 server_name(SNI 扩展)未随 JAVA 8 一起发送
有人知道为什么我在 java 8 中使用此代码时没有服务器扩展名称吗: try { URL url = new URL(urlString); URLC
dart - 扩展 dart 类类似于 js 原型(prototype)或 swift 扩展
扩展提供给我的类(class)。为现有的类提供新功能。或扩展现有的mixin s 或虚拟类，任何东西都可以工作。也许是这样的: class FlatButton {} // maybe no
python - 使用 c 扩展 python/django，使用 apache 扩展 mod_wsgi
我有一个关于使用 c 代码和 mod_wsgi 扩展 python 的问题。我在 apache 服务器中有一个 django 应用程序，它查询 postgresql 数据库以生成报告。在某些报告中，
google-chrome - testcafe 是否支持加载任何 crx 扩展，并使用 chrome 浏览器中的自定义 header 值设置 ModHeader 扩展
testcafe支持在Chrome浏览器中加载crx扩展吗？如果是这样，请告诉我需要尝试什么方法。我尝试了下面的代码，但没有成功 await t.eval(new Function(fs.read
java - 在 Java 中，类 B 扩展 A 和类 B 扩展 A 之间有什么区别
这个问题已经有答案了: What is a raw type and why shouldn't we use it? (16 个回答) 已关闭 3 年前。有什么区别: // 1 class A c
javascript - 单击 chrome 扩展 DOM(popup.html) 上的按钮时，扩展 DOM 关闭并且不会在 popup.js 中调用 onclick 函数
我正在编写一个 chrome 扩展来记录单击开始按钮后触发的请求。这是我的文件:1. list .json { "manifest_version": 2, "name": "recorde
Vim # 扩展
我每天都在使用 vim 和 perforce 现在我的问题是，如果我想查看 perforce 文件修订版，则从命令模式下的 vim :!p4 打印文件#1 vim 试图让我获得缓冲区 #1。有没有办法
NUnit 扩展
大家好，我有一个关于 NUnit 扩展(2.5.10)的问题。我想做的是向数据库。为此，我使用 Event 创建了 NUnit 扩展听众。我遇到的问题是公共(public)无效 TestFin
扩展。通过单击不在窗口中关闭弹出窗口
我有弹出窗口，而不是模态窗口。如何通过单击页面的其他部分(不在窗口中)来关闭此窗口？最佳答案像这样的东西: function closeWin(e, t) { var el = win.
C# 扩展
我通常非常谨慎地使用扩展方法。当我确实觉得有必要编写一个扩展方法时，有时我想重载该方法。我的问题是，您对调用其他扩展方法的扩展方法有何看法？不好的做法？感觉不对，但我无法真正定义原因。例如，第二个
16、扩展 Ant
扩展 Ant Ant带有一组预定义的任务，但是你可以创建自己的任务，如下面的例子所示。定制Ant 任务应扩展 org.apache.tools.ant.Task 类，同时也应该拓展 execut
用于重定向文件的 Firefox 扩展
我想要一个重定向所有请求的扩展: http://website.com/foo.js 到: http://localhost/myfoo.js 我无法使用主机文件将主机从 website.com 编辑
c++ - 扩展 QChartView
对于为什么 QChartView 放在 QTabWidget 中时会扩展，我有点迷惑。这是 QChartView 未展开(因为它被隐藏)时应用程序的图片。应用程序的黑色部分是 QOpenGLWid
oracle - 如何避免 OR 扩展？
如果在连接条件中使用 OR 运算符，如何优化以下查询以避免 SQL 调优方面的 OR 扩展？ SELECT t1.A, t2.B, t1.C, t1.D, t2.E FROM t1 LEFT J
.net - 扩展/插件通信架构
一旦加载插件的问题得到解决(在 .NET 中通过 MEF 的情况下)，下一步要解决的是与它们的通信。简单的方法是实现一个接口(interface)，使用插件实现，但有时插件只需要扩展应用程序的工作方式
symfony - 检查是否定义了功能/扩展
在我的 Symfony2 包中，我需要检查是否定义了一个函数(一个扩展)。更具体地说，如果安装了 KnpMenuBundle，我会在我的包中使用那个，否则我将自己渲染插件。我试过了，但这当然不起作用

首页

博学

6Ren·AI

商城

python - 扩展分组表格数据的高效算法