python - 在 numpy 中按间隔分割数组的简单方法-6ren

python - 在 numpy 中按间隔分割数组的简单方法

转载作者：太空宇宙更新时间：2023-11-03 17:03:36

我有矩阵，其中第一列是 UNIX 时间戳

[  1.44310344e+09   1.12127000e+00   1.12151000e+00]
[  1.44310350e+09   1.12043000e+00   1.12115000e+00]
[  1.44310356e+09   1.12069000e+00   1.12092000e+00]
 ..., 
[  1.44318942e+09   1.11952000e+00   1.11964000e+00]
[  1.44318948e+09   1.11957000e+00   1.11979000e+00]
[  1.44318954e+09   1.11930000e+00   1.11978000e+00]

我想要做的是找到 2 和 3 列的分钟间隔的最小值和最大值(基本上我想找到要价/出价数据的分钟烛台)

现在我就是这样做的

    candles = []
    period = 59
    for day in self.data:
        print(day)
        candles.append(np.empty((0, 4)))
        h, o, c, l = (-np.inf, np.inf, -np.inf, np.inf)
        time = day[-1, 0]
        for row in np.flipud(day):
            if row[0] < time-period:
                time = row[0]
                candles[-1] = np.append(candles[-1], [[h, o, c, l]], axis = 0)
                h, o, c, l = (-np.inf, np.inf, -np.inf, np.inf)
            h = max(h, row[1])
            o = min(o, row[1])
            c = max(c, row[2])
            l = min(l, row[2])

        if (h, o, c, l) != (-np.inf, np.inf, -np.inf, np.inf):
            candles[-1] = np.append(candles[-1], [[h, o, c, l]], axis = 0)

但是实在是太丑了。有没有更好的方法使用 numpy 或 pandas 来做到这一点？

最佳答案

IIUC您可以使用groupby , cut和 agg :

import pandas as pd
import numpy as np
import io

temp=u"""1.44310344e+09;1.12127000e+00;1.12151000e+00
1.44310350e+09;1.12043000e+00;1.12115000e+00
1.44310350e+09;2.12041000e+00;1.32115000e+00
1.44310350e+09;1.12043000e+00;1.12115000e+00
1.44310356e+09;1.12069000e+00;1.02092000e+00
1.44318942e+09;1.11952000e+00;1.11964000e+00
1.44318948e+09;1.11957000e+00;1.11979000e+00
1.44318954e+09;1.11930000e+00;1.11978000e+00"""

df = pd.read_csv(io.StringIO(temp), sep=";", names=['datetime','a','b'])
print df

#         time        a        b
#0  1443103440  1.12127  1.12151
#1  1443103500  1.12043  1.12115
#2  1443103500  2.12041  1.32115
#3  1443103500  1.12043  1.12115
#4  1443103560  1.12069  1.02092
#5  1443189420  1.11952  1.11964
#6  1443189480  1.11957  1.11979
#7  1443189540  1.11930  1.11978

df['datetime'] = pd.to_datetime(df['datetime'], unit='s')
print df

#             datetime        a        b
#0 2015-09-24 14:04:00  1.12127  1.12151
#1 2015-09-24 14:05:00  1.12043  1.12115
#2 2015-09-24 14:05:00  2.12041  1.32115
#3 2015-09-24 14:05:00  1.12043  1.12115
#4 2015-09-24 14:06:00  1.12069  1.02092
#5 2015-09-25 13:57:00  1.11952  1.11964
#6 2015-09-25 13:58:00  1.11957  1.11979
#7 2015-09-25 13:59:00  1.11930  1.11978

#convert datetime to minutes to new colum
df['minutes'] = df['datetime'].dt.minute
print df

#             datetime        a        b  minutes
#0 2015-09-24 14:04:00  1.12127  1.12151        4
#1 2015-09-24 14:05:00  1.12043  1.12115        5
#2 2015-09-24 14:05:00  2.12041  1.32115        5
#3 2015-09-24 14:05:00  1.12043  1.12115        5
#4 2015-09-24 14:06:00  1.12069  1.02092        6
#5 2015-09-25 13:57:00  1.11952  1.11964       57
#6 2015-09-25 13:58:00  1.11957  1.11979       58
#7 2015-09-25 13:59:00  1.11930  1.11978       59

#group by minutes and aggregate min and max values
g1 = df.groupby('minutes').agg({'a' : [np.min, np.max], 'b' : [np.min, np.max]})
#remove multicolumns - set new names of columns
g1.columns = ['amin','amax','bmix','bmax']
g1 = g1.reset_index()
print g1

#   minutes     amin     amax     bmix     bmax
#0        4  1.12127  1.12127  1.12151  1.12151
#1        5  1.12043  2.12041  1.12115  1.32115
#2        6  1.12069  1.12069  1.02092  1.02092
#3       57  1.11952  1.11952  1.11964  1.11964
#4       58  1.11957  1.11957  1.11979  1.11979
#5       59  1.11930  1.11930  1.11978  1.11978

bins = np.arange(0,60,1)
print bins

#[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
# 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
# 50 51 52 53 54 55 56 57 58 59]

#group by bins in column minutes
g2 = df.groupby([ pd.cut(df.minutes, bins)]).agg({'a' : [np.min, np.max], 
                                                  'b' : [np.min, np.max]})
#remove multicolumns - set new names of columns
g2.columns = ['amin','amax','bmix','bmax']
g2 = g2.reset_index()

print g2

#     minutes     amin     amax     bmin     bmax
#0     (0, 1]      NaN      NaN      NaN      NaN
#1     (1, 2]      NaN      NaN      NaN      NaN
#2     (2, 3]      NaN      NaN      NaN      NaN
#3     (3, 4]  1.12127  1.12127  1.12151  1.12151
#4     (4, 5]  1.12043  2.12041  1.12115  1.32115
#5     (5, 6]  1.12069  1.12069  1.02092  1.02092
#6     (6, 7]      NaN      NaN      NaN      NaN
#7     (7, 8]      NaN      NaN      NaN      NaN
#8     (8, 9]      NaN      NaN      NaN      NaN
#9    (9, 10]      NaN      NaN      NaN      NaN
#10  (10, 11]      NaN      NaN      NaN      NaN
#11  (11, 12]      NaN      NaN      NaN      NaN
#12  (12, 13]      NaN      NaN      NaN      NaN
#13  (13, 14]      NaN      NaN      NaN      NaN
#14  (14, 15]      NaN      NaN      NaN      NaN
#15  (15, 16]      NaN      NaN      NaN      NaN
#16  (16, 17]      NaN      NaN      NaN      NaN
#17  (17, 18]      NaN      NaN      NaN      NaN
#18  (18, 19]      NaN      NaN      NaN      NaN
#19  (19, 20]      NaN      NaN      NaN      NaN
#20  (20, 21]      NaN      NaN      NaN      NaN
#21  (21, 22]      NaN      NaN      NaN      NaN
#22  (22, 23]      NaN      NaN      NaN      NaN
#23  (23, 24]      NaN      NaN      NaN      NaN
#24  (24, 25]      NaN      NaN      NaN      NaN
#25  (25, 26]      NaN      NaN      NaN      NaN
#26  (26, 27]      NaN      NaN      NaN      NaN
#27  (27, 28]      NaN      NaN      NaN      NaN
#28  (28, 29]      NaN      NaN      NaN      NaN
#29  (29, 30]      NaN      NaN      NaN      NaN
#30  (30, 31]      NaN      NaN      NaN      NaN
#31  (31, 32]      NaN      NaN      NaN      NaN
#32  (32, 33]      NaN      NaN      NaN      NaN
#33  (33, 34]      NaN      NaN      NaN      NaN
#34  (34, 35]      NaN      NaN      NaN      NaN
#35  (35, 36]      NaN      NaN      NaN      NaN
#36  (36, 37]      NaN      NaN      NaN      NaN
#37  (37, 38]      NaN      NaN      NaN      NaN
#38  (38, 39]      NaN      NaN      NaN      NaN
#39  (39, 40]      NaN      NaN      NaN      NaN
#40  (40, 41]      NaN      NaN      NaN      NaN
#41  (41, 42]      NaN      NaN      NaN      NaN
#42  (42, 43]      NaN      NaN      NaN      NaN
#43  (43, 44]      NaN      NaN      NaN      NaN
#44  (44, 45]      NaN      NaN      NaN      NaN
#45  (45, 46]      NaN      NaN      NaN      NaN
#46  (46, 47]      NaN      NaN      NaN      NaN
#47  (47, 48]      NaN      NaN      NaN      NaN
#48  (48, 49]      NaN      NaN      NaN      NaN
#49  (49, 50]      NaN      NaN      NaN      NaN
#50  (50, 51]      NaN      NaN      NaN      NaN
#51  (51, 52]      NaN      NaN      NaN      NaN
#52  (52, 53]      NaN      NaN      NaN      NaN
#53  (53, 54]      NaN      NaN      NaN      NaN
#54  (54, 55]      NaN      NaN      NaN      NaN
#55  (55, 56]      NaN      NaN      NaN      NaN
#56  (56, 57]  1.11952  1.11952  1.11964  1.11964
#57  (57, 58]  1.11957  1.11957  1.11979  1.11979
#58  (58, 59]  1.11930  1.11930  1.11978  1.11978

关于python - 在 numpy 中按间隔分割数组的简单方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34790942/

文章推荐： c# - 如何让我的 C# PictureBox 传播鼠标事件？ (提供截图)

文章推荐： python - PRAW/Tweepy 过滤关键字

文章推荐： Ruby 捕获两个冒号之间的单词

文章推荐： python - Azure 上使用 SQLAlchemy 的 MSSQL "connection reset by peer"

java正则表达式字符串被 "not\"分割
实际上我只需要用JAVA编写一个简单的程序来将MySQL INSERTS行转换为CSV文件(每个mysql表等于一个CSV文件) 在JAVA中使用正则表达式是最好的解决方案吗？我的主要问题是如何正确
Java读取txt文件到hashmap，按 ":"分割
我有一个 txt 文件，其格式为: Key:value Key:value Key:value ... 我想将所有键及其值放入我创建的 hashMap 中。如何让 FileReader(file) 或
使用正则表达式进行 Java 分割
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。要求提供代码的问题必须表现出对所解决问题的最低限度的了解。包括尝试的解决方案、为什么它们不起作用以及预期结果
mysql - 分割.sql备份文件
我每周都会从我的主机下载数据库的备份。它生成一个 .sql 文件，当前大小约为 800mb。此 .sql 文件包含 44 个表。有什么方法可以通过某些软件将 .sql 文件与所有表分开，以便单独导出
iphone - 分割 CGImage
在 iOS 4.0 及更高版本中，有没有一种方法可以在不将整个图像加载到内存的情况下对 CGImage 进行分割？我试图做的是*以编程方式*分割图像，以便在使用大图像的 CATiledLayer 应用
javascript - 用这个字符: "\"分割
我的 .split() 函数有问题，我有以下字符串: var imageUrl = "Images\Products\randomImage.jpg"; 我想用字符“\”分割，但是，这种情况发生了:
javascript 正则表达式分割
是否可以使用正则表达式将字符串拆分两次？例如，假设我有字符串: example=email@address.com|fname|lname 如何拆分结果为: email@address.com,fna
Java 数组上的多线程(分割)
我正在寻找一种在线程系统(主从)中使用数组的解决方案，它允许我通过用户输入在多个线程上划分矩阵的计算，并将其通过 1 个主线程引导到多个从属线程，这些从属线程计算矩阵的 1 个字段。我尝试运用我的知
opencv - 分割 - 分离接触对象
我建立了一个系统来分割包含手写符号的二值图像并对它们进行分类(专门用于音乐)。我知道有商业应用程序可以执行此操作，但这是我尝试将其作为一个项目从头开始。为了简单起见，假设我的整个图像中有两个元素:
image - 物体检测+分割
我正在尝试找到一种可接受的复杂性的有效方法检测图像中的对象，以便将其与周围环境隔离将该对象分割成它的子部分并标记它们，这样我就可以随意获取它们我进入图像处理世界已经 3 周了，我已经阅读了很多算
algorithm - 3D 分割
我有一组3D 空间中的点。下图是一个示例: 我想把这些点变成一个面。我只知道点的 X、Y 和 Z 值。例如，查看下图，它显示了从 3D 空间中的点生成的人脸网格。我在谷歌上搜索了很多，但我找到的是一
java - 在字符串java中用字符*分割
我有一个字符串 String placeStr="place1*place2*place3"我想获取包含 place1、place2、place3 的数组，如下所示: String[] places=
Python URL 分割
我在 Python 中有一个类似于 google.com 的字符串，我想将其分成两部分:google 和 .com。问题是我有一个 URL，例如 subdomain.google.com，我想将其拆分
Python中使用pypdf2合并、分割、加密pdf文件的代码详解
朋友需要对一个pdf文件进行分割，在网上查了查发现这个pypdf2可以完成这些操作，所以就研究了下这个库，并做一些记录。首先pypdf2是python3版本的，在之前的2版本有一个对应pypdf库。
assembly - 8086 无操作系统编程；分割
伙计们，这是一个难以解决的问题，因为它涉及很多硬件细节，所以我想把它放到 EE.SE，但它的主要重点是编程，所以我决定坚持在这里。我最近怀旧(以及渴望回到 CPU 内在函数)，所以我决定自制一个 8
list - 分割 Haskell 列表
给定 haskell 中的排序列表，我如何获得分段列表，其中连续数字位于同一列表中。例如，如果我有一个排序列表 [1,2,3,4,7,8,10,12,13,15] 结果将是 [[1,2,3 ,4],[
cocoa :分割 View 的奇怪紫色约束
如果我添加三个分割 View ，如下图所示，第三个分割 View (称为 splitView-3)将自动为该分割 View 中的自定义 View 生成约束，例如 customview1 的 Heigh
javascript - 如果我取消选中该复选框以及如果我选中按 (", "分割，如何打印空白)
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 6 年前。 Improve th
java - 提供具有相同文件分割的 map 分割
如何为馈送给映射器的文件的每一行提供相同文件的拆分？基本上我想做的是 for each line in file-split { for each line in file{
hadoop - 带有Snappy压缩的ORC文件是否可在 strip 分割？
带有Snappy压缩功能的ORC文件是否可拆分成条形？据我所知，Snappy Compressed File是不可拆分的。但我在博客中读到，快速压缩的文件可以在 strip 上拆分。真的吗？最

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 在 numpy 中按间隔分割数组的简单方法