Python pandas "filter"仅交易日的时间序列-6ren

Python pandas "filter"仅交易日的时间序列

转载作者：行者123 更新时间：2023-12-01 04:57:07

25

4

我有两个数据集，如下所示:

enter image description here

我想做的是过滤掉“数据”数据框中的非交易日。我假设它将每行的 data.index.date 与 Trading_days 的 data.index.date 进行比较，然后如果存在匹配则返回该行。如果没有匹配，则这不是交易日，并且不返回该行。这有效地过滤掉了非交易日的数据集。

但是，使用 apply() 函数返回行逐行检查两个 data.index.date 是否相等似乎效率低下 - 我觉得有一种更有效的方法来做到这一点，因为我将在 180M 行数据帧上执行此操作。

是否有某种“合并”或“加入”，例如:

data.join(trading_days)

这将仅过滤 date.index.date 匹配的日期？我需要按分钟级别获取所有信息(如“数据”数据框中所示)，但只需过滤掉非交易日期。感谢您的帮助!

更新以包含值(请告诉我是否有更好的方法来粘贴这些值):

In[5]: data.head(30).values
Out[6]: 
array([[ 438.9,  438.9,  438.9,  438.9,    0. ],
       [ 438.9,  438.9,  438.7,  438.7,   31. ],
       [ 438.6,  438.6,  438.6,  438.6,    7. ],
       [ 438.4,  438.7,  438.4,  438.4,    4. ],
       [ 438.4,  438.4,  438.3,  438.3,    4. ],
       [ 438.2,  438.2,  438.2,  438.2,    1. ],
       [ 438.2,  438.2,  438.2,  438.2,    0. ],
       [ 438.2,  438.2,  438.2,  438.2,    1. ],
       [ 438.2,  438.2,  438.2,  438.2,    0. ],
       [ 438.1,  438.1,  438.1,  438.1,    3. ],
       [ 438. ,  438. ,  437.9,  438. ,    6. ],
       [ 438. ,  438.2,  438. ,  438. ,    8. ],
       [ 438.2,  438.2,  438.1,  438.1,    6. ],
       [ 438.1,  438.1,  438.1,  438.1,    4. ],
       [ 438.1,  438.1,  438.1,  438.1,    0. ],
       [ 438.3,  438.3,  438.3,  438.3,    1. ],
       [ 438.3,  438.3,  438.3,  438.3,    0. ],
       [ 438.3,  438.3,  438.3,  438.3,    0. ],
       [ 438.1,  438.1,  438.1,  438.1,    1. ],
       [ 438. ,  438. ,  437.9,  437.9,   54. ],
       [ 437.8,  437.8,  437.8,  437.8,   10. ],
       [ 437.8,  437.8,  437.8,  437.8,    1. ],
       [ 437.8,  437.8,  437.8,  437.8,    6. ],
       [ 437.8,  437.8,  437.8,  437.8,    0. ],
       [ 437.9,  438. ,  437.9,  438. ,   12. ],
       [ 437.9,  438. ,  437.9,  438. ,    0. ],
       [ 437.9,  438. ,  437.9,  438. ,    0. ],
       [ 437.9,  438. ,  437.9,  438. ,    0. ],
       [ 437.9,  437.9,  437.9,  437.9,    1. ],
       [ 437.9,  437.9,  437.8,  437.8,    4. ]])

这是时间戳:

In[10]: data.head(30).index.values
Out[11]: 
array(['2005-01-02T13:59:00.000000000-0500',
       '2005-01-02T14:00:00.000000000-0500',
       '2005-01-02T14:01:00.000000000-0500',
       '2005-01-02T14:02:00.000000000-0500',
       '2005-01-02T14:03:00.000000000-0500',
       '2005-01-02T14:04:00.000000000-0500',
       '2005-01-02T14:05:00.000000000-0500',
       '2005-01-02T14:06:00.000000000-0500',
       '2005-01-02T14:07:00.000000000-0500',
       '2005-01-02T14:08:00.000000000-0500',
       '2005-01-02T14:09:00.000000000-0500',
       '2005-01-02T14:10:00.000000000-0500',
       '2005-01-02T14:11:00.000000000-0500',
       '2005-01-02T14:12:00.000000000-0500',
       '2005-01-02T14:13:00.000000000-0500',
       '2005-01-02T14:14:00.000000000-0500',
       '2005-01-02T14:15:00.000000000-0500',
       '2005-01-02T14:16:00.000000000-0500',
       '2005-01-02T14:17:00.000000000-0500',
       '2005-01-02T14:18:00.000000000-0500',
       '2005-01-02T14:19:00.000000000-0500',
       '2005-01-02T14:20:00.000000000-0500',
       '2005-01-02T14:21:00.000000000-0500',
       '2005-01-02T14:22:00.000000000-0500',
       '2005-01-02T14:23:00.000000000-0500',
       '2005-01-02T14:24:00.000000000-0500',
       '2005-01-02T14:25:00.000000000-0500',
       '2005-01-02T14:26:00.000000000-0500',
       '2005-01-02T14:27:00.000000000-0500',
       '2005-01-02T14:28:00.000000000-0500'], dtype='datetime64[ns]')

交易日是从这里读取的.csv:http://pastebin.com/5N01Gi5V

第二次更新:

enter image description here

最佳答案

您可以通过以下方式加入:

向 data 添加一个 days 列，其中包含索引的日期。
pd.merge(days, data, on='days')

默认情况下，这会执行内部联接，因此只有 data 中的行(其天数出现在 days 框架中)才会出现在结果中。

关于Python pandas "filter"仅交易日的时间序列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27138198/

25

4

0

文章推荐： jQuery:包装每 2 个循环 append 元素

文章推荐： java - OSX 和 Windows 的字节数据类型有区别吗

文章推荐： jquery - Accordion 脚本在 ajax 更新面板中不起作用

javascript - Array.filter 与 $filter ('filter' )
我应该在 Angular 应用程序中使用哪个，为什么？ array.filter(o => o.name === myName); 或 $filter('filter')(array, {name:
django - 在 Django 中使用 ".filter().filter().filter()..."有什么缺点吗？
以下两个调用是否解析为 Django 中的等效 SQL 查询？链接多个调用 Model.objects \ .filter(arg1=foo) \ .filter(arg2=bar) \ ... 将
filter - java.lang.NoClassDefFoundError : org/apache/hadoop/hbase/filter/Filter 错误
我正在尝试在 hbase-1.0.0 上运行 completebulkload。但是遇到错误， "java.lang.NoClassDefFoundError: org/apache/hadoop/h
git - "--tree-filter"中的 "--index-filter"和 "git filter-branch"有什么区别？
我从这篇文章中学习了“树”和“索引”:Learning Git Internals by Example 但是当谈到“git filter-branch”命令时，我不知道“--tree-filter”
c# - 异常 : The given filter must implement one or more of the following filter interfaces when implementing custom filter in WebAPI 2
我正在尝试构建我的自定义过滤器以进行身份验证，但是当我尝试运行我的 WebAPI 解决方案时遇到了这个问题: The given filter instance must implement on
How to tag items by an array of filtering functions by the filtering functions names, smootly as I define new filtering functions(如何在定义新的过滤函数时，顺畅地通过过滤函数名称的过滤函数数组来标记项目)
我想保留一个过滤器函数的列表，并通过返回true的过滤器来标记这些项。这是接近但不完全。。主要问题是std：：stringify！总是返回“ADF”，可能是我声明为ADF的变量名。。第二个问题是，在定
How to tag items by an array of filtering functions by the filtering functions names, smootly as I define new filtering functions(如何在定义新的过滤函数时，顺畅地通过过滤函数名称的过滤函数数组来标记项目)
我想保留一个筛选器函数列表，并通过返回True的筛选器来标记这些项目。这已经很接近了，但还不完全是。。主要问题是std：：stringify！总是返回“ADF”，可能是我声明为ADF的变量名。。第二个
filter - graphql where filter - "Unknown argument\"where\"
我尝试在 graphql 查询中使用 where: filter 但不幸的是我遇到了一些错误。我做错了什么？ shoeposts { data { attributes(where: {s
filter - ZF2 : How do I implement a custom filter?
几周以来，我一直在使用 Zend Framework 2，尽管在线文档非常不完整，但我还是设法建立了我的网站的初稿。不幸的是，我在尝试实现 Zend\Filter\File\Rename 过滤器的自
filter - APC 中的 apc.filter
我正在尝试在 APC 中使用 apc.filter 等功能。但是我所做的一切都不起作用我应该完成 2 项任务。 1)需要包含1个目录用于缓存。我的代码在apc.ini apc.cache by de
filter - 你如何处理 Rust filter() 中的错误？
我想使用一个可能返回 Err 的过滤器函数结果，并将其冒泡到包含函数: mycoll.into_iter() .filter(|el| { if el == "bad" { E
filter - yii Controller filters() 方法模式
每个 Controller 都应该有方法filters()，在那里你可以指定一些类，我想知道，这些类是如何被框架包含的？这些类是如何配置的，以及何时配置，也许有人可以给我一个使用filters()并包
filter - 我如何自己编写 Matlab "filter"函数？
我想在一维信号上使用巴特沃斯滤波器。在 Matlab 中，脚本如下所示: f=100; f_cutoff = 20; fnorm =f_cutoff/(f/2); [b,a] = butter
filter - 不再支持 Neo4j Filter 功能
我想比较两个列表，以便找到第一个列表中不在第二个列表中的值并返回它们。提前谢谢大家代码返回:不再支持过滤器有没有其他方法可以做到这一点 MATCH (cu:Customer{name: "myCust
android - Filter.filter()的Filter.Filterlistener如何获取结果？
在 Android 应用程序中，我有一个通用设置 -- 一个带有 ArrayAdapter 的 ListView。在某一时刻，我调用了适配器的 getFilter().filter() 方法，它很好地
javascript - .filter 中的 ES6 .filter
所以我有如下数据: [ { "id": 0, "title": "happy dayys", "owner": {"id": "1", "username
javascript - 通过 $filter 创建和使用新的 `filter`
阅读Mastering Web Development with AngularJS ，我正在尝试创建并使用一个使用 $filter 模块/关键字的新过滤器。 HTML
ruby - 暂停在 Before filter 仍然进行到 After filter
所以我的理解是 halt 命令应该停止当前过滤器中的请求，但它似乎继续。下面是一个非常简单的 Sinatra 应用程序，演示了这一点。服务器.rb require 'sinatra' before
javascript - UIkit 3 的 Filter 组件 : Set active filter with URL hash - unable to change active filter with JS
我正在尝试将散列传递给 URL 以设置 UIkit 过滤器。 All
python - 使用 django-filters 将多个过滤器合并为一个 filter()
我正在使用 django-filter应用程序。但是有一个问题我不知道如何解决。它几乎与 django 文档中描述的完全相同: https://docs.djangoproject.com/en/1.

首页

博学

6Ren·AI

商城

Python pandas "filter"仅交易日的时间序列