python - 获取下n个交易日功能太慢-6ren

python - 获取下n个交易日功能太慢

转载作者：行者123 更新时间：2023-12-01 00:15:10

25

4

我创建了一个函数来生成下一个/前一个 n 个交易日，但对于我的目的来说太慢了。谁能建议一种加速该功能的方法？

def next_trading_day(start_day, num_trading_days, direction):
    '''returns the next/previous trading day. Business_days determines how many days
    back or into the future, direction determines whether back (-1) or forward (1)'''
    for i in range(0, num_trading_days, direction):
        next_day = start_day +datetime.timedelta(days=direction)
        while next_day.weekday() in [5,6] or next_day not in mcal.get_calendar('NYSE').valid_days(start_date='2000-12-20', end_date='2020-01-10'):
            next_day +=  datetime.timedelta(days=direction)
        start_day = next_day
    return start_day

这是我使用该功能的方式:

import pandas as pd
dict1 = [
        {'date': '2016-11-27'},
        {'date': '2016-11-28'},
{'date': '2016-11-27'},
]
df1= pd.DataFrame(dict1)
df1['date']      = pd.to_datetime(df1['date'])

df['Date-1']=df['date'].dt.date.apply(next_business_day, args=[-1,-1,])

最佳答案

此检查 next_day not in mcal.get_calendar('NYSE').valid_days(start_date='2000-12-20', end_date='2020-01-10') 非常及时 -消耗，因为它需要从超过 7000 天的数组中查找。而且你需要对每一个操作都执行此操作，因此我认为这是效率低下的主要原因。

您可以通过将 mcal.get_calendar('NYSE').valid_days(start_date='2000-12-20', end_date='2020-01-10') 转换为设置，这会将查找时间从 O(N) 降低到 O(log N)。

但我会选择另一种策略:

创建一个将每个交易日与其下一个和/或最后一个交易日相匹配的表格
将上表与您的数据中的日期合并
估算缺失值
将新创建的表与原始数据合并

编辑:允许任意数量的滞后和超前

import pandas as pd
import pandas_market_calendars as mcal

def get_next_trading_day(df1, n):
    trading_days = pd.DataFrame({"date": mcal.get_calendar('NYSE').valid_days(start_date='2016-11-10', end_date='2016-12-01')})
    trading_days['date'] = trading_days['date'].dt.tz_convert(None)
    trading_days = trading_days[~trading_days.date.dt.weekday.isin([5,6])]
    trading_days['next_trading_day'] = trading_days.date.shift(-n)
    # extract unique  date from df1
    df2 = pd.DataFrame({"date": pd.unique(df1['date'])})

    # merge with the trading days data (non-trading day will have NA fields)
    df2 = df2.merge(trading_days, on='date', how='outer')

    # impute NA values
    df2.sort_values(by='date', inplace=True)

    df2['next_trading_day'].fillna(method=  'ffill' if n>0 else 'bfill', inplace=True)

    return df1.merge(df2, on='date', how='left')

dict1 = [
        {'date': '2016-11-27'},
        {'date': '2016-11-28'},
        {'date': '2016-11-27'},
        ]
df1= pd.DataFrame(dict1)
df1['date']      = pd.to_datetime(df1['date'])


print("Next trading day")
print(get_next_trading_day(df1, 1))
print()

print("Previous trading day")
print(get_next_trading_day(df1, -1))
print()

print("Next next trading day")
print(get_next_trading_day(df1, 2))
print()

print("Previous previous trading day")
print(get_next_trading_day(df1, -2))
print()

输出

Next trading day
        date next_trading_day
0 2016-11-27       2016-11-28
1 2016-11-28       2016-11-29
2 2016-11-27       2016-11-28

Previous trading day
        date next_trading_day
0 2016-11-27       2016-11-25
1 2016-11-28       2016-11-25
2 2016-11-27       2016-11-25

Next next trading day
        date next_trading_day
0 2016-11-27       2016-11-29
1 2016-11-28       2016-11-30
2 2016-11-27       2016-11-29

Previous previous trading day
        date next_trading_day
0 2016-11-27       2016-11-23
1 2016-11-28       2016-11-23
2 2016-11-27       2016-11-23

关于python - 获取下n个交易日功能太慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59385992/

25

4

0

文章推荐： javascript - 向下滑动 SVG 元素的简单方法？

文章推荐： python - 在球体表面均匀分布点的万无一失的算法？

文章推荐： assembly - 为什么我没有指定 make add rm 命令？

cudaMemcpy 太慢
我用 cudaMemcpy()一次将 1GB 的数据精确复制到设备。这需要 5.9 秒。反之则需要 5.1 秒。这是正常的吗？函数本身在复制之前有这么多开销吗？理论上，PCIe 总线的吞吐量至少应为
Javascript 太慢？
我正在尝试读取图像的大小并在其高度大于 150 时调整其边距。但是在运行这段代码时，我总是在控制台中得到一个“0”: var coverImg; coverImg =
iphone - writeImageToSavedPhotosAlbum 太慢？
我正在开发一个 iPhone 应用程序，其中包含一些标准的“相机”功能。保存到相机胶卷真的太慢了，在iPhone 4上大约需要四秒钟。有什么办法可以提高速度吗？如果您查看默认的 iPhone 相
iphone - 转换为灰度 - 太慢
我创建了一个将图像转换为灰度的类。但它的工作速度太慢了。有没有办法让它运行得更快？这是我的类(class): @implementation PixelProcessing SYNTHESIZE_S
delphi - gethostbyaddr 太慢
我使用以下代码，结果是正确的，但 gethostbyaddr 需要大约 30 秒。 function IPAddrToName(IPAddr: string): string; var So
java - CopyOnWriteArrayList 太慢
我有以下案例， public class Test { private static final int MAX_NUMBER = 10_00_00; public static vo
java - ucanaccess 太慢
我已经正确添加了所有必需的 JARS: Ucanaccess 3.0.4 commons-lang-2.6 commons-logging-1.1.1 hsqldbd jackcess-2.1.3 我
Python 多重处理 - 太慢
我为特定功能构建了一个多处理密码破解程序(使用单词列表)，与使用单个进程相比，它减少了一半的时间。最初的问题是，它会向您显示破解的密码并终止工作人员，但剩余的工作人员将继续工作，直到他们用完可哈希的
extjs - Sencha 太慢
我在我的一个 JSP 中引入了 Sencha 网格。本地 sencha 相当快，但在外部服务器上它太慢了。我在这里按照部署说明进行操作 http://docs.sencha.com/ext-js/4
php - 从另一个表中选择值 - 太慢
我的查询加载时间有很大问题。在这种情况下，我需要 hg_ft_won 列(表:值)中的值，用于 home_team_id 和 away_team_id(表:匹配)。它确实可以正常工作。加载只需要很长
C# QuickSort 太慢
我现在正在学习不同类型的排序，我发现，从某个点开始，我的快速排序算法根本无法快速工作。这是我的代码: class QuickSort { // partitioning arr
Java regexp OR 太慢
为什么要模式 [0123]123456|98765 比在 Java 中执行 [0123]123456 然后 98765 慢两倍？所以单独搜索它们比用 OR 执行更快。有人有解释吗？ UPD 查看带有结
Android Assets 太慢
我有带 Assets 的 Android 应用程序。它们包含 20,000 多个文件，其中大部分是简单的文本或 png 文件，分为不同的文件夹和子文件夹。1 个单个文件的最大大小为 500kb，其中
php - GROUP_CONCAT 太慢
您好，我在查询中添加了 GROUP_CONCAT 函数，该函数终止了我的查询:/。我的查询是: SELECT u.username,a.user_id,a.id,a.text,a.lang as fr
PostgreSQL SELECT 太慢
我正在寻找优化查询的想法。目前，我有一个 4M 行的表，我只想检索引用的最后 1000 行: SELECT * FROM customers_material_events WHERE refere
ios - NSURLConnection 太慢
我在我的应用程序中使用 NSURLConnection，我在其中扫描条形码，通过 NSURLConnection 发送 XML，Java 服务向我发回 XML。我的问题是，使用 Wifi 时，响应时间
java - CopyOnWriteArraySet 太慢
当我运行以下程序时，执行大约需要 7 到 8 分钟。我真的不确定我哪里弄错了，因为这个程序执行起来要花很多时间。 public class Test { public stat
ios - NSFetchedResultsController 太慢
我正在使用 NSFetchResultsController 从数据库中接收项目(有 80.000 个项目)。这是我的谓词:@"(desc CONTAINS[cd] %@)", [any text]
Python fmin 太慢
我在 x_data 中有一个 3x2000 numpy 数组，在 y_data 中有一个 1x2000 numpy 数组，我将其传递给此函数 regress 以给我一条回归线。它工作正常。问题是我正在
c++ - cvtColor 太慢
我正在做一个项目，我需要改变图像的亮度和对比度，它是亮度而不是亮度。所以我一开始的代码是 for (int y = 0; y (y, x); // read pixel (0,0)

首页

博学

6Ren·AI

商城

python - 获取下n个交易日功能太慢