Pandas 重采样 OHLC 日内数据，不包括正常交易时间以外的数据-6ren

Pandas 重采样 OHLC 日内数据，不包括正常交易时间以外的数据

转载作者：行者123 更新时间：2023-12-04 03:12:40

26

4

我正在将 30 分钟数据重新采样为每小时数据，但它添加了代表 24 小时内所有 30 分钟时间段的 NaN 行。我希望它仅在 30 分钟记录中有数据时才重新采样。原始 df 没有任何“额外”行，只有 20 天内 9:30-4:00 的每小时数据。它还包括新的 df_RSHourly 中的周末。

df_RSHourly = df.resample('1H', base=0.5).agg(
    {'close': 'last','high': 'max','low': 'min', 'open': 'first', 'volume': 'sum'}
]

print df_RSHhourly

2017-04-25 09:30:00-04:00  238.75  238.52  237.91  237.81  151998.0
2017-04-25 10:30:00-04:00  238.62  238.44  238.53  238.33   64281.0
2017-04-25 11:30:00-04:00  238.66  238.56  238.44  238.36   58319.0
2017-04-25 12:30:00-04:00  238.71  238.59  238.56  238.29   47994.0
2017-04-25 13:30:00-04:00  238.82  238.69  238.59  238.52   58266.0
2017-04-25 14:30:00-04:00  238.95  238.84  238.69  238.57   73089.0
2017-04-25 15:30:00-04:00  238.83  238.53  238.83  238.53  103572.0
2017-04-25 16:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-25 17:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-25 18:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-25 19:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-25 20:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-25 21:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-25 22:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-25 23:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 00:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 01:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 02:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 03:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 04:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 05:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 06:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 07:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 08:30:00-04:00     NaN     NaN     NaN     NaN       NaN
2017-04-26 09:30:00-04:00  238.91  238.87  238.53  238.50   91978.0
2017-04-26 10:30:00-04:00  239.53  239.47  238.88  238.85   75444.0
2017-04-26 11:30:00-04:00  239.48  239.02  239.48  238.70   88402.0
2017-04-26 12:30:00-04:00  239.42  239.20  239.02  238.98   45661.0

最佳答案

我找到的最简单的解决方案是 between_time

df_RSHhourly.between_time('09:30', '16:00')

在我的代码中，这是我应用它的方式:

y = data['prices'].resample('60S').ohlc()
y = y.fillna(method='ffill')
y = y.between_time('09:30', '16:00')

引用:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.between_time.html

关于Pandas 重采样 OHLC 日内数据，不包括正常交易时间以外的数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43726689/

26

4

0

文章推荐： javascript - 在 Materialise Carousel 上禁用触摸

文章推荐： Angular ngFor 和分表到标题部分

文章推荐： python - Heroku 上的 Django 翻译无法完全正常工作

node.js - Chrome 的跟踪事件分析工具中的自上而下(树)、自上而下(重)和自下而上(重)有什么区别
我正在尝试使用谷歌浏览器的 Trace Event Profiling Tool分析我正在运行的 Node.js 应用程序。选择点样本后，我可以在三种 View 之间进行选择: 自上而下(树) 自上而
android - 重 ContentProvider 查询和 ListView
对于一个可能是菜鸟的问题，我们深表歉意，但尽管在 SO 上研究了大量教程和其他问题，但仍找不到答案。我想做的很简单:显示一个包含大量数据库存储字符串的 Android ListView。我所说的“很
css - 基础 5 div 重
我已经开始了一个新元素的工作，并决定给 Foundation 5 一个 bash，看看它是什么样的。在创建带有水平字段的表单时，我在文档中注意到的第一件事是它们使用大量 div 来设置样式。所以我在下
.net - 重 CPU 负载下的跨线程 BeginInvoke 阻塞
我有一个 Windows 窗体用户控件，其中包含一个使用 BeginInvoke 委托(delegate)调用从单独线程更新的第 3 方图像显示控件。在繁重的 CPU 负载下，UI 会锁定。当我附加
javascript - 什么是测试 Dom 重 js 的好方法？
我有一堆严重依赖dom元素的JS代码。我目前使用的测试解决方案依赖于 Selenium ，但 AFAIK 无法正确评估 js 错误(addScript 错误不会导致您的测试失败，而 getEval 会
Java Swing 重/慢 paintComponent - 有什么建议吗？
我正在制作一款基于滚动 2D map /图 block 的游戏。每个图 block (存储为图 block [21][11] - 每个 map 总共 231 个图 block )最多可以包含 21 个
javascript - 在网页上 - 如何显示(轻)图像并在客户端下载后者时将其替换为(重)图像？
考虑到以下情况，我是前端初学者: 某个 HTML 页面应该包含一个沉重的图像(例如 - 动画 gif)，但我不想强制客户缓慢地等待它完全下载才能享受一个漂亮的页面，而是我更愿意给他看一个轻量级图像(例
python - 重 I/O 和 python 多处理/多线程
我正在设计一个小软件，其中包括: 在互联网上获取资源，一些用户交互(资源的快速编辑)，一些处理。我想使用许多资源(它们都列在列表中)来这样做。每个都独立于其他。由于编辑部分很累，我想让用户(可能
c# - 重 I/O 操作中的 Parallel.ForEach 与异步 For 循环
我想比较两个理论场景。为了问题的目的，我简化了案例。但基本上它是您典型的生产者消费者场景。 (我关注的是消费者)。我有一个很大的Queue dataQueue我必须将其传输给多个客户端。那么让我们
python - K 重 CV 的变体，其中 size(test_set) > N/K
我有一个二元分类问题，标签 0 和 1(少数)存在巨大不平衡。由于测试集带有标签 1 的行太少，因此我将训练测试设置为至少 70-30 或 60-40，因此仍然有重要的观察结果。由于我没有过多地衡量准

首页

博学

6Ren·AI

商城

Pandas 重采样 OHLC 日内数据，不包括正常交易时间以外的数据