- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的数据框中有 65 K 条记录,例如下面的代码片段:
Scrip Timestamp1 NSETS NSEPr Buyq1 Buyq2 Buyq3 Buyq4 Buyq5 Sellq1 Sellq2 Sellq3 Sellq4 Sellq5 Sellp1 Sellp2 Sellp3 Sellp4 Sellp5 buyp1 buyp2 buyp3 buyp4 buyp5 ActPr TotalBuyQty TotalSellQty
ALANKIT 2018-01-12 13:02:06 2018-01-12 13:00:50 78.10 759.00 100.00 996.00 1287.00 200 15.00 300.00 100.00 1787.00 5614.00 78.25 78.35 78.40 78.45 78.50 78.10 78.05 78.00 77.80 77.75 78.25 63928 194206
ALANKIT 2018-01-12 13:32:29 2018-01-12 13:22:21 79.50 28.00 100.00 200.00 1288.00 248 50.00 178.00 898.00 100.00 487.00 79.50 79.55 79.60 79.65 79.75 79.30 79.15 79.10 79.05 78.80 79.20 61927 175983
ALANKIT 2018-01-12 13:36:26 2018-01-12 13:34:51 79.20 39.00 3649.00 1287.00 7.00 11 1500.00 1024.00 1000.00 220.00 65.00 79.20 79.25 79.50 79.55 79.60 79.15 79.00 78.85 78.65 78.55 79.00 65503 176990
ALANKIT 2018-01-12 14:32:29 2018-01-12 14:31:23 78.80 810.00 1000.00 1287.00 1342.00 555 58.00 20.00 100.00 10.00 1250.00 78.80 78.85 78.90 78.95 79.00 78.70 78.60 78.55 78.50 78.30 78.70 84405 184759
ALANKIT 2018-01-12 14:12:58 2018-01-12 14:11:22 78.50 1.00 5.00 100.00 25.00 510 2542.00 25.00 95.00 50.00 500.00 78.50 78.55 78.60 78.85 78.90 78.30 78.25 78.20 78.15 78.10 78.85 74505 189866
APEX 2018-03-05 14:14:30 2018-03-05 14:13:23 72.00 51.00 71.00 20.00 150 1.00 1.00 14.00 20.00 1108.00 690.00 690.15 690.80 690.95 691.00 689.60 689.55 689.45 689.15 689.00 0 35535 61963 690.00
APEX 2018-01-31 11:52:11 2018-01-31 11:50:48 100.00 10.00 10.00 15.00 50 50.00 50.00 10.00 16.00 67.00 621.15 621.20 621.40 621.80 621.95 619.50 619.00 618.00 617.00 616.50 0 8083 25609 619.50
APEX 2018-01-31 11:56:14 2018-01-31 11:54:48 38.00 29.00 67.00 174.00 124 53.00 50.00 50.00 16.00 25.00 625.00 625.40 625.45 626.00 626.90 623.95 623.90 623.50 623.45 623.00 0 12587 23399 624.00
APEX 2018-01-18 09:36:03 2018-01-18 09:35:14 38.00 46.00 67.00 226.00 6 5.00 50.00 36.00 20.00 30.00 781.00 781.80 781.85 781.95 782.00 780.20 780.15 780.05 780.00 779.95 782.70 17023 21946 780.75
APEX 2018-01-18 09:44:16 2018-01-18 09:42:15 47.00 50.00 25.00 67.00 2887 25.00 8.00 58.00 5.00 50.00 791.60 791.65 791.95 792.30 792.65 790.20 790.15 790.00 789.05 789.00 791.45 22314 26007 790.05
STRTECH 2018-01-19 14:57:51 2018-01-19 14:56:24 68.50 1.00 5.00 2.00 3 3.00 20.00 3.00 5.00 10.00 2484.95 2485.00 2489.00 2489.90 2490.00 2477.55 2477.50 2477.20 2477.05 2476.70 2480.60 32408 8565 2485.00
STRTECH 2018-01-25 10:50:10 2018-01-25 10:47:46 32.65 1.00 511.00 1.00 12 9.00 5.00 100.00 23.00 20.00 2484.60 2484.70 2484.80 2485.00 2486.00 2480.15 2480.10 2480.00 2475.00 2471.15 2534.60 28306 18002 2484.70
在相同的脚本和相同的日期(来自字段Timestamp1)中,我想查询所有记录并返回满足2个复杂条件的记录。
这些条件是:
a)NSEPr 值应比那一天的 NSEPr 第一个值至少高 3.5%(可以从此处的 Timetamp1 中提取日期)
b) SellQ1 + SellQ2..(直到Sell 5)的值(value)总和应为 3 倍(或高于 BuyQ1 + BuyQ2..(直到BuyQ5)的值(value)总和。
我设法使用 df['mydt'] = df.Timestamp1.dt.date..
从 timestamp1 中提取日期我尝试使用 for 循环和 df.iterrows() 来实现上述任务,即遍历 Df。由于无限循环而失败。
我记得上面的内容可以使用 df.groupby['Scrip','mydt'].apply 实现或者也许通过使用 df.groupby['scrip','mydt'].apply(lambda x
但是我无法找到解决方案。我非常感谢对上述问题的一些帮助。
TIA。
最佳答案
它看起来像:
# get the first values per scrip and day
df_a_first_vals= df.groupby([df['Timestamp1'].dt.date, df['Scrip']]).agg({'NSEPr': 'first'})
# create an indexer for condition b and extract the
# corresponding data with the date stored in a separate
# column
df_b_indexer= df[['Sellq1', 'Sellq2', 'Sellq3', 'Sellq4', 'Sellq5']].sum(axis='columns') >= df[['Buyq1', 'Buyq2', 'Buyq3', 'Buyq4', 'Buyq5']].sum(axis='columns')*3
df_b_data= df[df_b_indexer].copy(deep=True)
df_b_data['Timestamp1_date']= df_b_data['Timestamp1'].dt.date
# merge a and b to apply condition a
df_ab_merged= df_b_data.merge(df_a_first_vals, left_on=['Timestamp1_date', 'Scrip'], right_index=True, suffixes=['', '_first'])
# output the result
df_ab_merged[df_ab_merged['NSEPr']>=df_ab_merged['NSEPr_first']*1.035]
您的数据似乎不包含这样的记录,因此我只是将 (APEX, 2018-01-31T11:52:11)
的 NSEPr 值从 100.00 更改为 20.00。然后上面的逻辑输出当天的第二行:
Out[148]:
Scrip Timestamp1 NSETS NSEPr ... TotalBuyQty TotalSellQty Timestamp1_date NSEPr_first
7 APEX 2018-01-31 11:56:14 2018-01-31 11:54:48 38.0 ... 23399 624.0 2018-01-31 20.0
[1 rows x 29 columns]
顺便说一句,如果您的数据非常大并且您想避免上面的深层复制,您可以将 Timestamp1
的日期部分存储为单独的列。
测试数据(我只是手动更改了倒数第二条记录,所以它符合条件):
raw="""Scrip Timestamp1 NSETS NSEPr Buyq1 Buyq2 Buyq3 Buyq4 Buyq5 Sellq1 Sellq2 Sellq3 Sellq4 Sellq5 Sellp1 Sellp2 Sellp3 Sellp4 Sellp5 buyp1 buyp2 buyp3 buyp4 buyp5 ActPr TotalBuyQty TotalSellQty
ALANKIT 2018-01-12T13:02:06 2018-01-12T13:00:50 78.10 759.00 100.00 996.00 1287.00 200 15.00 300.00 100.00 1787.00 5614.00 78.25 78.35 78.40 78.45 78.50 78.10 78.05 78.00 77.80 77.75 78.25 63928 194206
ALANKIT 2018-01-12T13:32:29 2018-01-12T13:22:21 79.50 28.00 100.00 200.00 1288.00 248 50.00 178.00 898.00 100.00 487.00 79.50 79.55 79.60 79.65 79.75 79.30 79.15 79.10 79.05 78.80 79.20 61927 175983
ALANKIT 2018-01-12T13:36:26 2018-01-12T13:34:51 79.20 39.00 3649.00 1287.00 7.00 11 1500.00 1024.00 1000.00 220.00 65.00 79.20 79.25 79.50 79.55 79.60 79.15 79.00 78.85 78.65 78.55 79.00 65503 176990
ALANKIT 2018-01-12T14:32:29 2018-01-12T14:31:23 78.80 810.00 1000.00 1287.00 1342.00 555 58.00 20.00 100.00 10.00 1250.00 78.80 78.85 78.90 78.95 79.00 78.70 78.60 78.55 78.50 78.30 78.70 84405 184759
ALANKIT 2018-01-12T14:12:58 2018-01-12T14:11:22 78.50 1.00 5.00 100.00 25.00 510 2542.00 25.00 95.00 50.00 500.00 78.50 78.55 78.60 78.85 78.90 78.30 78.25 78.20 78.15 78.10 78.85 74505 189866
APEX 2018-03-05T14:14:30 2018-03-05T14:13:23 72.00 51.00 71.00 20.00 150 1.00 1.00 14.00 20.00 1108.00 690.00 690.15 690.80 690.95 691.00 689.60 689.55 689.45 689.15 689.00 0 35535 61963 690.00
APEX 2018-01-31T11:52:11 2018-01-31T11:50:48 20.00 10.00 10.00 15.00 50 50.00 50.00 10.00 16.00 67.00 621.15 621.20 621.40 621.80 621.95 619.50 619.00 618.00 617.00 616.50 0 8083 25609 619.50
APEX 2018-01-31T11:56:14 2018-01-31T11:54:48 38.00 29.00 67.00 174.00 124 53.00 50.00 50.00 16.00 25.00 625.00 625.40 625.45 626.00 626.90 623.95 623.90 623.50 623.45 623.00 0 12587 23399 624.00
APEX 2018-01-18T09:36:03 2018-01-18T09:35:14 38.00 46.00 67.00 226.00 6 5.00 50.00 36.00 20.00 30.00 781.00 781.80 781.85 781.95 782.00 780.20 780.15 780.05 780.00 779.95 782.70 17023 21946 780.75
APEX 2018-01-18T09:44:16 2018-01-18T09:42:15 47.00 50.00 25.00 67.00 2887 25.00 8.00 58.00 5.00 50.00 791.60 791.65 791.95 792.30 792.65 790.20 790.15 790.00 789.05 789.00 791.45 22314 26007 790.05
STRTECH 2018-01-19T14:57:51 2018-01-19T14:56:24 20.50 1.00 5.00 2.00 3 3.00 20.00 3.00 5.00 10.00 2484.95 2485.00 2489.00 2489.90 2490.00 2477.55 2477.50 2477.20 2477.05 2476.70 2480.60 32408 8565 2485.00
STRTECH 2018-01-19T15:50:10 2018-01-25T10:47:46 32.65 1.00 511.00 1.00 12 9.00 5.00 100.00 23.00 20.00 2484.60 2484.70 2484.80 2485.00 2486.00 2480.15 2480.10 2480.00 2475.00 2471.15 2534.60 28306 18002 2484.70"""
df= pd.read_csv(io.StringIO(raw), sep='\s+', parse_dates=['Timestamp1', 'NSETS'], index_col=None)
结果:
Out[212]:
Scrip Timestamp1 NSETS NSEPr ... TotalBuyQty TotalSellQty Timestamp1_date NSEPr_first
11 STRTECH 2018-01-19 15:50:10 2018-01-25 10:47:46 32.65 ... 18002 2484.7 2018-01-19 20.5
[1 rows x 29 columns]
关于python - Pandas:满足类别内多个条件的所有结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57542174/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 9 个月前关闭。 Improve
我使用 partykit打包并遇到以下错误消息: Error in matrix(0, nrow = mi, ncol = nl) : invalid 'nrow' value (too large
我一直在尝试寻找一个量表或分类指标,为 VADER 情绪分析分配一些情感程度,而不仅仅是积极、消极或中性。如果有人可以分享他们的观点或资源来帮助按以下方式对 VADER 复合分数进行分类,我将非常感激
伙计们,我想自动循环..但我不知道是我放错了 while 还是循环错了? 我的数据库 标签:kt_barang kd_kategori | nama_kategori 1
我正在创建一个列出本地企业并按类别、子类别和关键字对它们进行分组的应用程序。以下是企业排序规则: 一个企业可以属于多个类别和子类别 一个企业可以有多个关键字 并非每个类别都有子类别,但有子类别的只有两
我有一系列单词 - 我的刺激 - 它们显示在屏幕上。然而,每个词都有另一个“条件”,即它们是类别 A、类别 B 或类别 C。这可能很简单,但我找不到答案并坚持下去。我的最终目标是在每次运行脚本时将类别
我正在使用 Laravel 5.5 和 MySql。如果不向 Services 表中添加 subCategoryID 列,我无法弄清楚如何将类别和子类别与服务相关联。 目前这是我的表结构 服务类别 i
我有两个部分/类别结构的链接表。 the section table structure id sec_title 1 section 1 2 section 2 the category str
我有一个类层次结构如下 @interface PTLDatasource : NSObject ... @interface PTLFetchedDatasource : PTLDatasource
我有一个 DataFrame df 一列,category 使用以下代码创建: import pandas as pd import random as rand from string import
我经常在多个类中设置获取请求以从核心数据(加上一些其他结果)中检索“allRecipes”或“lastModifiedDate”。 为此使用专门的类别 NSManagedObjectContext+R
可以在 Objective C 中创建类别之间的依赖关系吗?也在类别和它们的基类之间? 我知道在运行时应该没有区别,它们可能只是在编译时合并在一起。例如,假设我将 B 类分解为: B(base cla
这个问题在这里已经有了答案: 关闭 10 年前。
example img of a category selection by user 嘿,我正在尝试设置一个选择,用户必须选择一个类别和第二个类别,但我不知道如何获取他单击的信息。用户单击类别后,它
尝试将投资组合库添加到我正在制作的自定义 wp 主题中。我已经筋疲力尽地试图寻找甚至可以修改一些的解决方案和插件。我认为我在寻找解决方案时遇到的一个问题是我不完全确定哪些搜索词可以帮助我找到与我想要实
当我查看 Cocoa Touch API 时,我可以在同一个头文件中找到一些与类别一起声明的类,例如 @interface NSArray : NSObject @property (readonl
我的 log4j.properties 中有以下内容 log4j.rootLogger = debug, stdout, fileLog log4j.appender.stdout = org.apa
如果我在类中添加类别方法,比如NSXMLNode: @interface NSXMLNode (mycat) - (void)myFunc; @end NSXMLNode 的子类,例如 NSXMLEl
先说场景,wordpress的分类结构是这样的 Level 1: Top Level 2: -Nextme_1 Level 3: --Nextme_2 --Nextme_3 Leve
我有一个解析网络,现在我想浏览标签,或显示图表。我怎样才能得到图表?或者在树中导航。显示第一步然后其他等。并了解这棵树是如何 build 的。 import urllib from lxml impo
我是一名优秀的程序员,十分优秀!