python - 在 python 中滚动 idxmax()？-6ren

python - 在 python 中滚动 idxmax()？

转载作者：行者123 更新时间：2023-11-28 22:56:00

24

4

我有一个包含一些财务数据的 python DataFrame，我正在尝试为其创建一些技术指标。我想弄清楚如何使用移动窗口函数来加速这个过程，而不是逐个元素地进行。对于每个索引，我想返回最近 30 天的最大索引。我实现了一个逐个元素的解决方案，但正如您想象的那样，它慢得可怕。

    for s_sym in ls_symbols:
        for i in range(refresh, len(ldt_timestamps)):
            #Aroon-Up = ((period - Days Since High)/period) x 100 Aroon-Down = ((period - Days Since Low)/peiod) x 100'''
            whrmax = df_close[s_sym].ix[ldt_timestamps[i-uplen:i]].idxmax()
            maxaway = (df_close[s_sym].ix[whrmax : ldt_timestamps[i-1]]).count()
            aroonup = ((uplen - maxaway) / uplen ) * 100

            whrmin = df_close[s_sym].ix[ldt_timestamps[i-dnlen:i]].idxmin()
            minaway = df_close[s_sym].ix[whrmin : ldt_timestamps[i-1]].count()
            aroondn = ((dnlen - minaway) / dnlen ) * 100

如何创建自定义滚动窗口函数？

最佳答案

查看文档:

http://pandas.pydata.org/pandas-docs/dev/computation.html#moving-rolling-statistics-moments

还有一些很好的例子:

http://pandas.pydata.org/pandas-docs/dev/cookbook.html#grouping

In [18]: df = DataFrame(randn(1000,4),index=pd.date_range('20000101',periods=1000),
                 columns=list('ABCD'))

In [19]: pandas.stats.moments.rolling_apply(df,30,lambda x: Series(x).idxmax())
Out[19]: 
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 1000 entries, 2000-01-01 00:00:00 to 2002-09-26 00:00:00
Freq: D
Data columns (total 4 columns):
A    971  non-null values
B    971  non-null values
C    971  non-null values
D    971  non-null values
dtypes: float64(4)

In [47]: pandas.stats.moments.rolling_apply(df,30,lambda x: Series(x).idxmax()).tail(30)
Out[47]: 
             A   B   C   D
2002-08-28  24   3  26  21
2002-08-29  23   2  25  20
2002-08-30  22   1  24  19
2002-08-31  21   0  23  18
2002-09-01  20   6  29  17
2002-09-02  19   5  28  16
2002-09-03  18   4  27  15
2002-09-04  17   3  26  14
2002-09-05  16   2  25  13
2002-09-06  15   1  24  12
2002-09-07  14   0  23  11
2002-09-08  13  13  22  10
2002-09-09  12  12  21   9
2002-09-10  11  11  20   8
2002-09-11  10  10  19   7
2002-09-12   9   9  18   6
2002-09-13   8   8  17   5
2002-09-14   7   7  16   4
2002-09-15   6   6  15   3
2002-09-16   5   5  14   2
2002-09-17   4   4  13   1
2002-09-18   3   3  12   0
2002-09-19   2   2  11  11
2002-09-20   1   1  10  10
2002-09-21   0   0   9   9
2002-09-22  27  25   8   8
2002-09-23  26  24   7   7
2002-09-24  25  23   6   6
2002-09-25  24  22   5   5
2002-09-26  23  29   4   4

仅供引用，你可能几乎肯定只使用 rolling_max(df,30) 来获得特定范围内的最大值，这就是我收集到的你想要的

关于python - 在 python 中滚动 idxmax()？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16157913/

24

4

0

文章推荐： spring - 在tomcat中通过 hudson 部署时出错

文章推荐： objective-c - 从数组中抓取项目时崩溃... objective-c

文章推荐： java - 在 Vaadin 6 中检测应用程序停止

python - idxmax() 给出无法找到的索引。
问候，我有一个索引从 0 到 00.6279999999999999 的 df。我使用 idxmax() 查找一列中最大变量的索引 - df[Column A]。假设索引是 0.5579999999
python - 在分层数据帧上使用 idxmax
我正在尝试查找多索引 Pandas 数据帧中多列中最大值的索引。 Kommune Upplands Vallentuna... Kiruna Year Party 19
python - 我如何计算滚动 idxmax
考虑 pd.Series s import pandas as pd import numpy as np np.random.seed([3,1415]) s = pd.Series(np.rand
python - pandas idxmax 返回所有具有最大值的列
我有一个如下所示的数据框: column_1 column_2 2 3 6 4 5 5 . . . 我想为上述数据框的每一行返回该行中
python - pandas idxmax 返回所有具有最大值的列
我有一个如下所示的数据框: column_1 column_2 2 3 6 4 5 5 . . . 我想为上述数据框的每一行返回该行中
python - 从每组的另一列获取与 idxmax 对应的列值
我有一个由 3 列和 n 行组成的数据框。分组前我的数据框看起来像 Index Max_Mass (kg/m) Max_Diameter (m) 1 10
python - 使用 idxmax 求最大值
我正在尝试计算夏季金牌数和冬季金牌数相对于金牌总数的最大差异。问题是我只需要考虑在夏季和冬季都至少赢得 1 枚金牌的国家。 Gold: Count of summer gold medals Gold
python - 如何根据 idxmax 对数据框进行排序？
我有一个这样的数据框: A B C 0 1 2 1 1 3 -8 10 2 10 3 -20 3 50 7 1 我想根据每列中最大绝对值的索引重新排列它的列。
python - 如何在最大值索引 idxmax() 之前找到索引？
这个问题在这里已经有了答案: Pandas: Find index of the row with second highest value (2 个答案) 关闭 4 年前。我有一个以 Count
python - 有没有比 idxmax 更快的替代方法？
这个问题在这里已经有了答案: Select the max row per group - pandas performance issue (2 个答案) 关闭 4 年前。 import time
用于数据框中多个索引的 Python pandas idxmax
我有一个看起来像这样的系列: delivery 2007-04-26 706 23 2007-04-27 705 10
python - 在 python 中滚动 idxmax()？
我有一个包含一些财务数据的 python DataFrame，我正在尝试为其创建一些技术指标。我想弄清楚如何使用移动窗口函数来加速这个过程，而不是逐个元素地进行。对于每个索引，我想返回最近 30 天的
Python Pandas groupby forloop & Idxmax
我有一个必须按三个级别分组的 DataFrame，然后返回最高值。每天每个唯一值都有一个返回，我想找到最高返回和细节。 data.groupby(['Company','Product','Indus
Python Pandas Dataframe idxmax 太慢了。备择方案？
我正在尝试使用 df.loc[df.groupby(keys)['column'].idxmax()] 按最大值从组中选择行。但是，我发现 df.groupby(keys)['column'].id
python - 用于 Pandas `idxmax` 方法的时间复杂度/算法
您好，我正在尝试了解 pd.DataFrame.idxmax 的效率，看看是否值得用可能更高效的自定义算法(例如，使用二进制搜索)替换它。我想了解此方法背后的算法或至少了解其复杂性，但到目前为止我还
python - 在 Pandas 中使用 idxmax 保留重复值
我有一个数据框，其中有两列，id 和 date。 df = pd.DataFrame([[1, '2019-05-20'], [1, '2019-05-20'], [1, '2018-04-23'],
python - 在 Pandas 中使用 idxmax 保留重复值
我有一个数据框，其中有两列，id 和 date。 df = pd.DataFrame([[1, '2019-05-20'], [1, '2019-05-20'], [1, '2018-04-23'],
python - idxmax() 不适用于包含 NaN 的 SeriesGroupBy
这是我的代码 from pandas import DataFrame, Series import pandas as pd import numpy as np income = DataFram
python - 我可以在所有情况下使用 idxmax() 代替 argmax() 吗？
我发现 idxmax() 在 argmax() 不起作用的情况下有效(例如在整个数据帧上)，但是在某些情况下我需要 argmax()？如果不是，我会把它从我的脑海中抹去。最佳答案有区别。 pd.D
python - dataframe.idxmax() - 前 N 次出现
Pandas dataframe.idxmax()函数返回请求轴上第一次出现最大值的索引。有没有办法返回前 N 次出现的索引？有问题的行: df2 = df.loc[df.groupby(['co

首页

博学

6Ren·AI

商城

python - 在 python 中滚动 idxmax()？