python - 使用 numpy.loadtxt 解析包含 HH :MM:SS. mmm 次的数据矩阵-6ren

python - 使用 numpy.loadtxt 解析包含 HH :MM:SS. mmm 次的数据矩阵

转载作者：太空宇宙更新时间：2023-11-04 10:35:35

25

4

我知道我可以做类似的事情

numpy.loadtxt('data.txt', dtype={'names': ('time', 'magnitude'),
                                 'formats': ('S12', 'f8')})

但这给了我时间作为一个字符串。我怎样才能把它操纵成一个 float ？

最佳答案

您可以使用 converter parameter将函数应用于第一列中的每个字符串。为每一行调用一次 Python 函数可能会大大降低 np.loadtxt 的速度，但这对于中等大小的文件来说仍然是一个可行的解决方案:

import numpy as np

def parse_date(datestr):
    return sum([multiplier*val for multiplier, val in
                zip((3600, 60, 1), map(float, datestr.split(':')))])


x = np.loadtxt('data', dtype={'names': ('time', 'magnitude'), 'formats': ('f8', 'f8')},
               converters={0:parse_date})
print(x)

或者，您可以在使用 loadtxt 后将字符串解析为 float ，如下所示:

x = np.loadtxt('data', dtype={'names': ('time', 'magnitude'), 'formats': ('S12', 'f8')})
arr = np.char.split(x['time'], ':')
# http://stackoverflow.com/a/19459439/190597 (Jaime)
newarr = np.fromiter((tuple(row) for row in arr), dtype=[('', np.float)]*3,
                     count=len(arr)).view('float').reshape(-1, 3)
times = (newarr * [3600,60,1]).sum(axis=1)

y = np.empty_like(x, dtype={'names': ('time', 'magnitude'), 'formats': ('f8', 'f8')})
y['time'] = times
y['magnitude'] = x['magnitude']
print(y)

编辑:我创建了一个 10**6 行的测试文件来测试哪种方法更快。第二种方法快一点:

In [329]: %timeit using_fromiter()
1 loops, best of 3: 5.59 s per loop


In [328]: %timeit using_converter()
1 loops, best of 3: 6.88 s per loop

import os
import numpy as np

def create_data(N):
    data = np.random.random(size=N)*86400
    hours, remainder = data.__divmod__(3600)
    minutes, seconds = remainder.__divmod__(60)
    mag = np.arange(N)
    filename = os.path.expanduser('~/tmp/data')
    with open(filename, 'w') as f:
        for h,m,s,a in np.column_stack([hours, minutes, seconds, mag]):
            f.write('{h:d}:{m:d}:{s:.6f} {a}\n'.format(h=int(h), m=int(m), s=s, a=a))

def parse_date(datestr):
    return sum([multiplier*val for multiplier, val in
                zip((3600, 60, 1), map(float, datestr.split(':')))])

def using_converter():
    x = np.loadtxt('data', dtype={'names': ('time', 'magnitude'),
                                  'formats': ('f8', 'f8')},
                   converters={0:parse_date})
    return x

def using_fromiter():
    x = np.loadtxt('data', dtype={'names': ('time', 'magnitude'), 'formats': ('S12', 'f8')})
    arr = np.char.split(x['time'], ':')
    newarr = np.fromiter((tuple(row) for row in arr), dtype=[('', np.float)]*3,
                         count=len(arr)).view('float').reshape(-1, 3)
    times = (newarr * [3600,60,1]).sum(axis=1)

    y = np.empty_like(x, dtype={'names': ('time', 'magnitude'), 'formats': ('f8', 'f8')})
    y['time'] = times
    y['magnitude'] = x['magnitude']
    return y

create_data(10**6)

关于python - 使用 numpy.loadtxt 解析包含 HH :MM:SS. mmm 次的数据矩阵，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23482308/

25

4

0

文章推荐： java - Android 应用程序在 Calender.getInstance 处没有响应

文章推荐： java - 如何将 JProgressBar 设置为音频文件的持续时间？

文章推荐： html - 媒体查询规则不优先

文章推荐： java - Android如何检查php消息以验证登录

java - 如何将字符串 yyyy-MM-ssThh-mm-ss 转换为 LocalDataTime yyyy-MM-ss hh-mm-ss？
如标题所示，我有一个问题。我需要将 LocalDataTime yyyy-MM-ssThh-mm-ss 解析为 LocalDataTime yyyy-MM-ss hh-mm-ss 但是当我这样做时 S
c++ - 如何在循环中表示不再输入字符串 ss while (cin >> ss)
我使用“cin”从输入流中读取单词，比如 int main( ){ string word; while (cin >> word){ //do sth on t
java - 转换 hh :mm:ss to mmm:ss
我有一个 Java 函数可以将秒数转换为特定格式 (hh:mm:ss): public static String formatChronometer(long seconds) { retu
c++ - 在 ss.clear() 之后为新定义的字符串流使用 ss.str ("")
(学习C++)我一直在看下面的代码部分: stringstream ss; // more code ss.clear(); ss.str(""); 为什么 ss.str(""); 调用时 ss.cl
excel - 转换[h] :mm:ss to mm:ss in Excel
我有一个从 GPS 跟踪器收集的数据集。数据中的总时间应为 mm:ss。但 Excel 将其解释为小时和分钟。如何使用公式将其转换为分钟和秒？在下面的示例中，32 应该是 32 分钟，15 应该是
java - 将 GWT 中的时间值格式化为 HH :mm:ss. SS
我的时间格式如下 public static final String TIME_FORMAT = "HH:mm:ss.SS"; edition.getEditionDate().format(T
python - 如何将 mm :ss. ms 转换为 ss.ms？
我正在尝试对以下示例进行转换: 原始时间:1:03.091 转换时间:63.09 我做了一些研究，发现我可以将分钟添加到秒，但不知道如何添加毫秒。以下是我迄今为止所做的事情: a = "01:40.4
postgresql - PostgreSQL-如何将包含秒数的 float 转换为 MM :SS. ss
我有一个包含秒数的 float8，即 65.455。我试图在 View 中设置列的格式，使其显示为 1:05.455。像这样使用 postgres 命令:TO_CHAR((user_data.tot
vba - 我需要一个 VBA 代码来计算从 ss 到 ss 的行数，返回该数字并复制并粘贴该行和所有其他列
我有 vba 问题，我一直试图找到答案很长时间。我有来自众多客户的大量电子表格，我在这些电子表格上运行宏，我是编码新手，并且能够大致弄清楚我需要做什么。我的客户每月向我们发送数据，并且每个月的行数都在
javascript - 允许 MM :SS, TH 或 SS,TH 的正则表达式
我正在尝试编写一个正则表达式，允许输入以分钟、秒、十分之一和百分之一为单位的时间。我遇到的问题是，还应该允许用户输入仅秒和十分之一或秒、十分之一和百分之一的时间。变化如下: 分:秒:日分:秒:日毫米:
c - "ss+1"在 scanf ("%s"， ss+1) 中意味着什么？
我想知道输入“+1”是什么意思 scanf("%s", ss+1) 其中 ss 是字符串输入。我正在解决 codechef 上的一个问题，当我尝试阅读其他一些解决方案以了解其他可能的解决方案/方法时
javascript - jquery/javascript 中的字符串验证为 MM :ss not HH:MM:ss
我想验证 jquery 函数接收的某个字符串。这是我到目前为止所做的 var duration=$('#duration').val(); if(//string validation?) {
algorithm - 在 Porter Stemming 算法中，包含 SS -> SS 等身份规则的目的是什么？
Porter Stemmer algorithm 的意义何在？是否有将 SS 转换为 SS 的规则？最佳答案假设规则 SS->SS 不在算法中。然后像 caress 这样的词根本不会被识别，而且算
milliseconds - MPV 播放器时间格式 HH :MM:SS or HH:MM:SS:mmm
有谁知道，是否可以在 mpv.conf 中设置包括毫秒在内的默认显示时间格式？现在我需要点击时间切换到毫秒，因为手册中的选项 ,,timems'' https://mpv.io/manual/mas
java - 如何将 Java 中存储在 long 中的经过的毫秒数转换为格式为 mm :ss. ss 的字符串？
我有一个按以下方式计算的变量 currTime: long currTime = System.currentTimeMillis() - start; //where start is the st
javascript - 将秒转换为 HH :MM:SS:MS and/or HH:MM:SS;F
我正在尝试编写将秒数转换为以下格式的逻辑: HH:MM:SS:MS，其中 MS 为毫秒 HH:MM:SS;F，其中 F 是帧 (不仅仅是 HH:MM:SS，因此这个问题与 Stackoverflow
java - 想要 "dd/MM/yyyy HH:mm:ss.SS"格式的当前日期和时间
我正在使用以下代码以“dd/MM/yyyy HH:mm:ss.SS”格式获取日期。 import java.text.SimpleDateFormat; import java.uti
python - 从 HH :MM:SS to HH:SS 重新格式化 matplotlib x 轴
我有一天中每一分钟的数据点: import numpy as np data = np.random.random(1440,) # I can represent minutes as intege
php - 如何转换 HH :MM:SS to H:SS AM/PM from SQL database with TIME_FORMAT
这是查询的工作版本。我只需要用 AS 保存新值。谢谢 Andy。 $Wednesday = mysqli_query($conn, "SELECT *,TIME_FORMAT(class_start,
sql - 如何从 `hh:mm:ss`中提取 `yyyy/mm/dd hh:mm:ss`
我有下表没有时区的时间戳(6) 2000/01/01 0:00:00 2000/01/01 10:00:00 2000/01/01 04:00:00 我想得到hh:mm:ss我想要的结果如下 0:00

首页

博学

6Ren·AI

商城

python - 使用 numpy.loadtxt 解析包含 HH :MM:SS. mmm 次的数据矩阵