Python/Pandas 重新采样外汇报价数据以获取报价量-6ren

Python/Pandas 重新采样外汇报价数据以获取报价量

转载作者：行者123 更新时间：2023-12-05 07:54:32

25

4

我有一堆滴答数据，我可以使用以下方法成功地将其重新采样为时间数据:

h5_file = pd.HDFStore(h5_path)
h5_file['fx_data'].groupby('Symbol')
ask = grouped['Ask'].resample('5Min', how='ohlc')
bid = grouped['Bid'].resample('5Min', how='ohlc')

但我还想返返回价量。这应该只是组成每个样本的行数。如何才能最好地实现这一点？

此外 - 当我选择使用较小的时间范围重新采样时，偶尔会出现值为 N/A 的条柱，因为该期间没有价格变化。发生这种情况时，我希望前一个收盘价是当前柱上 OHLC 的值。

我搜索并找到了这段代码:

whatev.groupby('Symbol')closes = resampledData['close'].fillna(method='pad')
resampledData.apply(lambda x: x.fillna(closes)

我对 Python 和编程还很陌生，还不了解 lambas。这会仅更改关闭值还是我需要更改的所有值。非常感谢所有帮助。

最佳答案

我在 hdf5 中获得了您的部分示异常(exception)汇数据(2015 年 5 月的美元/欧元)的副本，因此我将在此处使用它来进行说明。

import pandas as pd

Jian_h5 = '/media/Primary Disk/Jian_Python_Data_Storage.h5'
h5_file = pd.HDFStore(Jian_h5)  

fx_df = h5_file['fx_tick_data']
# I've only got USD/EUR in this dataset, but let's still do a groupby symbol
# and assume you have multiple symbols
grouped = fx_df.groupby('Symbol')

# calculate sub-group average bid and ask price, and also number of ticks
freq = '1min'
# an empty DataFrame
result = pd.DataFrame()
# bid/ask price: forward fill make sense
result['avg_bid'] = grouped['Bid'].resample(freq, how='mean').fillna(method='ffill')
result['avg_ask'] = grouped['Ask'].resample(freq, how='mean').fillna(method='ffill')
# tick count: NaN should be replaced by zero
result['tick_counts'] = grouped['Ask'].resample(freq, how='count').fillna(0)

Out[59]: 
                             avg_bid  avg_ask  tick_counts
Symbol  Date_time                                         
EUR/USD 2015-05-01 00:00:00   1.1210   1.1210           77
        2015-05-01 00:01:00   1.1209   1.1210          117
        2015-05-01 00:02:00   1.1209   1.1210           95
        2015-05-01 00:03:00   1.1210   1.1210           46
        2015-05-01 00:04:00   1.1211   1.1211          112
        2015-05-01 00:05:00   1.1213   1.1213          193
        2015-05-01 00:06:00   1.1214   1.1215           76
        2015-05-01 00:07:00   1.1216   1.1216          103
        2015-05-01 00:08:00   1.1216   1.1217          107
        2015-05-01 00:09:00   1.1217   1.1217           17
        2015-05-01 00:10:00   1.1216   1.1217           33
        2015-05-01 00:11:00   1.1218   1.1218           56
        2015-05-01 00:12:00   1.1217   1.1218           77
        2015-05-01 00:13:00   1.1215   1.1215           18
        2015-05-01 00:14:00   1.1215   1.1216           50
...                              ...      ...          ...
        2015-05-31 23:45:00   1.0959   1.0960           37
        2015-05-31 23:46:00   1.0959   1.0959           59
        2015-05-31 23:47:00   1.0958   1.0959           62
        2015-05-31 23:48:00   1.0956   1.0957           45
        2015-05-31 23:49:00   1.0955   1.0956           67
        2015-05-31 23:50:00   1.0955   1.0956           36
        2015-05-31 23:51:00   1.0955   1.0956           35
        2015-05-31 23:52:00   1.0956   1.0956           22
        2015-05-31 23:53:00   1.0956   1.0957           29
        2015-05-31 23:54:00   1.0957   1.0958           50
        2015-05-31 23:55:00   1.0956   1.0957           30
        2015-05-31 23:56:00   1.0957   1.0958            8
        2015-05-31 23:57:00   1.0957   1.0958           45
        2015-05-31 23:58:00   1.0957   1.0958           38
        2015-05-31 23:59:00   1.0958   1.0958           30

[44640 rows x 3 columns]

关于Python/Pandas 重新采样外汇报价数据以获取报价量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31192256/

25

4

0

文章推荐： android - ImageView setImageDrawable 导致绘制空白图像

文章推荐： JAVA JScrollPane 不显示

文章推荐： java - Apache HttpClient 持久连接使用

文章推荐： .net - 是什么决定了 WCF WSDL 中 XML 属性的顺序？

pandas - Pandas 交叉表与 Pandas 数据透视表有何不同？
pandas.crosstab 和 Pandas 数据透视表似乎都提供了完全相同的功能。有什么不同吗？最佳答案 pivot_table没有 normalize争论，不幸的是。在 crosstab
pandas - 从 pandas 值序列创建 pandas 区间序列
我能找到的最接近的答案似乎太复杂:How I can create an interval column in pandas? 如果我有一个如下所示的 pandas 数据框: +-------+ |
pandas - 将一列值移动到另一列 - Pandas
这是我用来将某一行的一列值移动到同一行的另一列的当前代码: #Move 2014/15 column ValB to column ValA df.loc[(df.Survey_year == 201
pandas - 如何将包含 bins 的 pandas 数据框写入文件以便将其读回 pandas？
我有一个以下格式的 Pandas 数据框: df = pd.DataFrame({'a' : [0,1,2,3,4,5,6], 'b' : [-0.5, 0.0, 1.0, 1.2, 1.4,
pandas - Pandas 数据框行上的克罗内克积
所以我有这两个数据框，我想得到一个新的数据框，它由两个数据框的行的克罗内克积组成。正确的做法是什么？举个例子:数据框1 c1 c2 0 10 100 1 11 110 2 12
pandas - Pandas 条形图中的刻度标签重叠
TL;DR:在 pandas 中，如何绘制条形图以使其 x 轴刻度标签看起来像折线图？我制作了一个间隔均匀的时间序列(每天一个项目)，并且可以像这样很好地绘制它: intensity[350:450
pandas - Pandas 中两个时间戳之间的差异
我有以下两个时间列，“Time1”和“Time2”。我必须计算 Pandas 中的“差异”列，即 (Time2-Time1): Time1 Time2
pandas - ( Pandas )根据顺序无关紧要的子集删除重复项
从这个 df 去的正确方法是什么: >>> df=pd.DataFrame({'a':['jeff','bob','jill'], 'b':['bob','jeff','mike']}) >>> df
pandas - Pandas 中唯一值的累积计数
我想按周从 Pandas 框架中的列中累积计算唯一值。例如，假设我有这样的数据: df = pd.DataFrame({'user_id':[1,1,1,2,2,2],'week':[1,1,2,1,
pandas - Pandas 更改数据透视表中列的顺序
数据透视表的表示形式看起来不像我在寻找的东西，更具体地说，结果行的顺序。我不知道如何以正确的方式进行更改。 df示例: test_df = pd.DataFrame({'name':['name_1
pandas - Pandas 中的分组召回
我有一个数据框，如下所示。 Category Actual Predicted 1 1 1 1 0
pandas - 计算从日期时间列到特定日期的天数 - pandas
我有一个 df，如下所示。 df: ID open_date limit 1 2020-06-03 100 1 2020-06-23 500
pandas - 删除不等于唯一项目值的行 - Pandas
我有一个 df ，其中包含与唯一值关联的各种字符串。对于这些唯一值，我想删除不等于单独列表的行，最后一行除外。下面使用 Label 中的各种字符串值与 Item 相关联.所以对于每个唯一的 Item
pandas - Pandas 按索引删除列会删除所有具有相同名称的列
考虑以下具有相同名称的列的数据框（显然，这确实发生了，目前我有一个像这样的数据集！:(） >>> df = pd.DataFrame({"a":range(10,15),"b":range(5,10)
pandas - Pandas DF中的重复行
我在 Pandas 中有一个 DF，它看起来像: Letters Numbers A 1 A 3 A 2 A 1 B 1 B 2
pandas - Pandas 两列之间的时差
如何减去两列之间的时间并将其转换为分钟 Date Time Ordered Time Delivered 0 1/11/19 9:25:00 am 10:58:00 am
pandas - pandas 使用哪种方法计算百分位数？
我试图理解 pandas 中的下/上百分位数计算，但有点困惑。这是它的示例代码和输出。 test = pd.Series([7, 15, 36, 39, 40, 41]) test.describe(
pandas - 如何提取多索引数据帧的索引名称，pandas
我有一个多索引数据框，如下所示: TQ bought HT Detailed Instru
pandas - Pandas :根据字符串计数创建直方图
我需要从包含值“低”，“中”或“高”的数据框列创建直方图。当我尝试执行通常的df.column.hist（）时，出现以下错误。 ex3.Severity.value_counts() Out[85]:
pandas - Pandas 中的子字符串列基于另一列
我试图根据另一列的长度对一列进行子串，但结果集是 NaN .我究竟做错了什么？ import pandas as pd df = pd.DataFrame([['abcdefghi','xyz'],

首页

博学

6Ren·AI

商城

Python/Pandas 重新采样外汇报价数据以获取报价量