- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个包含两列的 DataFrame
userID duration
0 DSm7ysk 03:08:49
1 no51CdJ 00:35:50
2 ...
“持续时间”的类型为 timedelta。我试过使用
bins = [dt.timedelta(minutes = 0), dt.timedelta(minutes =
5),dt.timedelta(minutes = 10),dt.timedelta(minutes =
20),dt.timedelta(minutes = 30), dt.timedelta(hours = 4)]
labels = ['0-5min','5-10min','10-20min','20-30min','30min+']
df['bins'] = pd.cut(df['duration'], bins, labels = labels)
但是,分箱数据不使用指定的分箱,而是为帧中的每个持续时间创建。
将 timedelta 对象分箱到不规则分箱中的最简单方法是什么?或者我只是在这里遗漏了一些明显的东西?
最佳答案
它适用于 pandas 0.23.4
import pandas as pd
import numpy as np
df = pd.DataFrame({
'userID': ['DSm7ysk', 'no51CdJ', 'foo', 'bar'],
'duration': [pd.Timedelta('3 hours 8 minutes 49 seconds'), pd.Timedelta('35 minutes 50 seconds'), pd.Timedelta('1 minutes 13 seconds'), pd.Timedelta('6 minutes 43 seconds')]
})
bins = [
pd.Timedelta(minutes = 0),
pd.Timedelta(minutes = 5),
pd.Timedelta(minutes = 10),
pd.Timedelta(minutes = 20),
pd.Timedelta(minutes = 30),
pd.Timedelta(hours = 4)
]
labels = ['0-5min', '5-10min', '10-20min', '20-30min', '30min+']
df['bins'] = pd.cut(df['duration'], bins, labels = labels)
结果:
关于Python/Pandas 分箱数据 Timedelta,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46930291/
将标准 timedelta 字符串转换为 timedelta 对象的最简单方法是什么? 我已经打印了几个 timedelta 对象并得到了这些字符串: '1157 days, 9:46:39' '12
我正在尝试将一个 timedelta 对象与另一个对象相除以计算服务器正常运行时间: >>> import datetime >>> installation_date=datetime.dateti
这里我有一个包含日期、时间和一个输入的数据集。这里我想添加特定时间的 timedelta 并添加到日期时间列。 所以这里首先我将指定时间转换为 00:00:00,它将作为开始时间。从那时起,我想添加一
dta_h 是一个 DataFrame,dta_h.Datetime 看起来像这样: 0 2013-03-01 00:00:00 1 2013-02-28 23:00:00 2 20
我想知道 timedelta 有多少小时在白天和夜晚范围内。 时间开始: >>> dt_start = datetime.datetime(2012, 8, 19, 16, 0) 时间停止: >>>
我的 pandas 数据框中的一列表示我用 datetime 计算的时间增量,然后导出到 csv 并读回 pandas 数据框中。现在该列的 dtype 是对象,而我希望它是一个 timedelta,
这是我的代码: import datetime date = datetime.date(2015,10,1) today = datetime..today() oneday = datetime.
我正在尝试通过包含在同一数据框的另一列中的值来增加 pandas 数据框中的日期,如下所示 loans['est_close_date'] = loans['dealdate'] + loans['t
在我为现有数据库编写的 Web 应用程序中,我需要计算现在和存储在数据库中的时间戳之间的差异(在文本字段中,这很愚蠢,我知道)。这是我的 sqlalchemy Ban 类和相关方法。 class Ba
使用 Python 2.6 给定以下代码行,我如何从数据库中的变量动态构建 timedelta 的值? next_alert_date = datetime.strptime(start_due_da
下面是我正在处理的代码。据我所知,没有问题,但是当我尝试运行这段代码时,我收到了一个错误。 import os import datetime def parseOptions(): impo
例子假设对于一个给定的日期,当我们加上timedelta(days=180),并得到新的日期时,是否考虑闰年并计算新的日期?或者我们是否只计算当前日期的闰年,是否 Feb 有 28/29 天,并在 p
不确定如何处理这个问题。 用户提供一个参数,即 program.exe '2001-08-12' 我需要为该参数添加一天 - 这将代表程序另一部分的日期范围。我知道您可以从当天添加或减去,但如何从用户
我正在解决 Exercism.io 千兆秒问题: “计算某人活了 10^9 秒的时刻。” 我的方法是将 datetime 输入转换为时间戳,添加 10**9,然后转换回来。我的答案非常接近,但测试套件
我有一个大型数据库,正在加载到内存缓存中。我有一个过程可以每天迭代数据。 最近这个过程已经开始抛出以下错误: OverflowError: date value out of range对于线 sta
我有一个 时间值(value)存放在一个名为 newTime 的变量中. 当打印 newTime它给了我这样的结果 newTime = 0:07:00女巫很棒,因为我喜欢那样。 但是当保存 newTi
我有一些数据系列,这是一种 timedelta 数据类型。我想将这些 timedelta 绘制成条形图,其中 y 轴应仅以小时为单位而不是其他格式进行标记。以前,当我在 matplotlib 中尝试绘
菜鸟在这里, 我一直试图将军事时间的用户输入呈现为标准时间。代码到目前为止有效,但我需要从结束时间减去 12 小时才能在标准时间显示。我如何使用 datetime.time 做到这一点?另外,我是否需
我有一个 timedelta 数据框 JC time 1 3days 21:02:05 2 1days 23:50:07 3 6days 19:28:36 但我想要 1 93:02:05 2 47:5
我需要在表的一列中保存时间间隔。基于:http://docs.sqlalchemy.org/en/rel_0_8/core/types.html 我可以用 Interval键入。我的数据库是SQLit
我是一名优秀的程序员,十分优秀!