- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
(与 this answer 相关)
给定一个 df
,我期待得到 df.expanding()
的结果并使用 df
对此执行一些多元操作(涉及 .apply()
的多个列的操作同时在扩展的行窗口上进行) .事实证明这是不可能的。
所以,就像上面链接的答案一样,我需要使用 numpy.as_strides
的 df
.除了,与上面链接的问题相反,使用 strides 来扩展我的 df
的 View 。 ,而不是滚动窗口(扩展窗口的左侧固定,右侧逐渐向右移动)。
考虑这个df
:
import numpy
import pandas
df = pandas.DataFrame(numpy.random.normal(0, 1, [100, 2]), columns=['size_A', 'size_B']).cumsum(axis=0)
考虑此代码以提取 W
的滚动窗口那行 df
(这来自上面的答案):
def get_sliding_window(df, W):
a = df.values
s0,s1 = a.strides
m,n = a.shape
return numpy.lib.stride_tricks\
.as_strided(a,shape=(m-W+1,W,n),strides=(s0,s0,s1))
roll_window = get_sliding_window(df, W = 3)
roll_window[2]
现在我要修改get_sliding_window
让它返回df 的扩展窗口(而不是滚动窗口):
def get_expanding_window(df):
a = df.values
s0,s1 = a.strides
m,n = a.shape
out = numpy.lib.stride_tricks\
.as_strided(a, shape=(m,m,n),strides=(s0,s0,s1))
return out
expg_window = get_expanding_window(df)
expg_window[2]
但我没有使用 as_strided
的参数正确地:我似乎无法获得正确的矩阵——那将是这样的:
[df.iloc[0:1].values ,df.iloc[0:2].values, df.iloc[0:3].values,...]
@ThomasKühn 在评论中建议使用列表理解。这将解决问题,但速度太慢。费用是多少?
一个向量值函数,我们可以比较成本列表理解 .expand()
.它不小:
numpy.random.seed(123)
df = pandas.DataFrame((numpy.random.normal(0, 1, 10000)), columns=['Value'])
%timeit method_1 = numpy.array([df.Value.iloc[range(j + 1)].sum() for j in range(df.shape[0])])
给出:
6.37 s ± 219 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
与 .expanding()
相比:
%timeit method_2 = df.expanding(0).apply(lambda x: x.sum())
给出:
35.5 ms ± 356 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
最后,关于我要解决的问题有更多的细节在对 this 的评论中问题。
最佳答案
我写了几个函数,它们都应该做同样的事情,但需要不同的时间来完成任务:
import timeit
import numba as nb
x = np.random.normal(0,1,(10000,2))
def f1():
res = [np.sum(x[:i,0] > x[i,1]) for i in range(x.shape[0])]
return res
def f2():
buf = np.empty(x.shape[0])
res = np.empty(x.shape[0])
for i in range(x.shape[0]):
buf[:i] = x[:i,0] > x[i,1]
res[i] = np.sum(buf[:i])
return res
def f3():
res = np.empty(x.shape[0])
for i in range(x.shape[0]):
res[i] = np.sum(x[:i,0] > x[i,1])
return res
@nb.jit(nopython=True)
def f2_nb():
buf = np.empty(x.shape[0])
res = np.empty(x.shape[0])
for i in range(x.shape[0]):
buf[:i] = x[:i,0] > x[i,1]
res[i] = np.sum(buf[:i])
return res
@nb.jit(nopython=True)
def f3_nb():
res = np.empty(x.shape[0])
for i in range(x.shape[0]):
res[i] = np.sum(x[:i,0] > x[i,1])
return res
##checking that all functions give the same result:
print('checking correctness')
print(np.all(f1()==f2()))
print(np.all(f1()==f3()))
print(np.all(f1()==f2_nb()))
print(np.all(f1()==f3_nb()))
print('+'*50)
print('performance tests')
print('f1()')
print(min(timeit.Timer(
'f1()',
setup = 'from __main__ import f1,x',
).repeat(7,10)))
print('-'*50)
print('f2()')
print(min(timeit.Timer(
'f2()',
setup = 'from __main__ import f2,x',
).repeat(7,10)))
print('-'*50)
print('f3()')
print(min(timeit.Timer(
'f3()',
setup = 'from __main__ import f3,x',
).repeat(7,10)))
print('-'*50)
print('f2_nb()')
print(min(timeit.Timer(
'f2_nb()',
setup = 'from __main__ import f2_nb,x',
).repeat(7,10)))
print('-'*50)
print('f3_nb()')
print(min(timeit.Timer(
'f3_nb()',
setup = 'from __main__ import f3_nb,x',
).repeat(7,10)))
如您所见,差异并不大,但在性能上存在一些差异。最后两个函数只是早期函数的“重复”,但使用了 numba
优化。速度测试的结果是
checking correctness
True
True
True
True
++++++++++++++++++++++++++++++++++++++++++++++++++
performance tests
f1()
2.02294262702344
--------------------------------------------------
f2()
3.0964318679762073
--------------------------------------------------
f3()
1.9573561699944548
--------------------------------------------------
f2_nb()
1.3796060049789958
--------------------------------------------------
f3_nb()
0.48667875200044364
如您所见,差异并不大,但在最慢和最快的函数之间,加速比大约是 6 倍。希望这会有所帮助。
关于python - 提取 DataFrame 的扩展窗口(numpy strided),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48822715/
我是 magento 的新手,目前我在 magento 安装期间遇到“必须加载 PHP 扩展 curl ”错误。你能帮帮我吗? 最佳答案 如果您的服务器上没有安装 curl,您可以键入以下命令之一来安
我在 macOS Mojave/macOS Big Sur/macOS Monterey/macOS Ventura 上使用最新的 php 版本 7.2 并收到类似错误 $composer requ
这个问题已经有答案了: Why generic type is not applicable for argument extends super class for both? (5 个回答) 已关
我正在使用 NightWatch.js 并进行一些 UI 测试,我想用一些额外的 desiredCapabilities 启动默认浏览器实例(即启用扩展并应用一些特定值)。 p> 注意:我可以执行这些
有人知道为什么我在 java 8 中使用此代码时没有服务器扩展名称吗: try { URL url = new URL(urlString); URLC
扩展提供给我的类(class)。为现有的类提供新功能。或扩展现有的mixin s 或虚拟类,任何东西都可以工作。 也许是这样的: class FlatButton {} // maybe no
我有一个关于使用 c 代码和 mod_wsgi 扩展 python 的问题。 我在 apache 服务器中有一个 django 应用程序,它查询 postgresql 数据库以生成报告。在某些报告中,
testcafe支持在Chrome浏览器中加载crx扩展吗? 如果是这样,请告诉我需要尝试什么方法。 我尝试了下面的代码,但没有成功 await t.eval(new Function(fs.read
这个问题已经有答案了: What is a raw type and why shouldn't we use it? (16 个回答) 已关闭 3 年前。 有什么区别: // 1 class A c
我正在编写一个 chrome 扩展来记录单击开始按钮后触发的请求。 这是我的文件:1. list .json { "manifest_version": 2, "name": "recorde
我每天都在使用 vim 和 perforce 现在我的问题是,如果我想查看 perforce 文件修订版,则从命令模式下的 vim :!p4 打印文件#1 vim 试图让我获得缓冲区 #1。有没有办法
大家好,我有一个关于 NUnit 扩展(2.5.10)的问题。 我想做的是向 数据库。为此,我使用 Event 创建了 NUnit 扩展 听众。 我遇到的问题是公共(public)无效 TestFin
我有弹出窗口,而不是模态窗口。 如何通过单击页面的其他部分(不在窗口中)来关闭此窗口? 最佳答案 像这样的东西: function closeWin(e, t) { var el = win.
我通常非常谨慎地使用扩展方法。当我确实觉得有必要编写一个扩展方法时,有时我想重载该方法。我的问题是,您对调用其他扩展方法的扩展方法有何看法?不好的做法?感觉不对,但我无法真正定义原因。 例如,第二个
扩展 Ant Ant带有一组预定义的任务,但是你可以创建自己的任务,如下面的例子所示。 定制Ant 任务应扩展 org.apache.tools.ant.Task 类,同时也应该拓展 execut
我想要一个重定向所有请求的扩展: http://website.com/foo.js 到: http://localhost/myfoo.js 我无法使用主机文件将主机从 website.com 编辑
对于为什么 QChartView 放在 QTabWidget 中时会扩展,我有点迷惑。 这是 QChartView 未展开(因为它被隐藏)时应用程序的图片。 应用程序的黑色部分是 QOpenGLWid
如果在连接条件中使用 OR 运算符,如何优化以下查询以避免 SQL 调优方面的 OR 扩展? SELECT t1.A, t2.B, t1.C, t1.D, t2.E FROM t1 LEFT J
一旦加载插件的问题得到解决(在 .NET 中通过 MEF 的情况下),下一步要解决的是与它们的通信。简单的方法是实现一个接口(interface),使用插件实现,但有时插件只需要扩展应用程序的工作方式
在我的 Symfony2 包中,我需要检查是否定义了一个函数(一个扩展)。更具体地说,如果安装了 KnpMenuBundle,我会在我的包中使用那个,否则我将自己渲染插件。 我试过了,但这当然不起作用
我是一名优秀的程序员,十分优秀!