- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我想计算提及某事的日期和发布该消息的日期之间的差异。所以我有下一个数据框
df_test= pd.DataFrame([{'Mention Date': pd.Timestamp('2015-09-17 12:47:06'),
'Publication Date': pd.Timestamp('1684-01-01 00:00:00')},
{'Mention Date': pd.Timestamp('2015-09-17 12:47:06'),
'Publication Date': pd.Timestamp('2013-01-01 00:00:00')},
{'Mention Date': pd.Timestamp('2015-09-17 12:47:06'),
'Publication Date': pd.Timestamp('1724-01-01 00:00:00')},
{'Mention Date': pd.Timestamp('2015-01-01'),
'Publication Date': pd.Timestamp('1722-09-22 00:12:43.1453')},
{'Mention Date': pd.Timestamp('2015-01-01'),
'Publication Date': pd.Timestamp('1722-09-22 00:00:00')}])
现在我想计算“提及日期”和“发布日期”之间的差异。
print df_test["Mention Date"] - df_test["Publication Date"]
0 -92350 days +13:12:32.290448
1 989 days 12:47:06
2 106545 days 12:47:06
3 106751 days 23:47:16.854700
4 -106752 days +00:25:26.290448
dtype: timedelta64[ns]
正如您所看到的,第 0 行和第 4 行的响应是错误的。差异在任何地方都应该是正数。
如果我只做逐个值的差异,那么 react 是肯定的。请参阅下面的代码。
print df_test.loc[0]["Mention Date"] - df_test.loc[0]["Publication Date"]
print df_test.loc[3]["Mention Date"] - df_test.loc[3]["Publication Date"]
print type(df_test.loc[0]["Mention Date"] - df_test.loc[0]["Publication Date"])
121154 days, 12:47:06
106751 days 23:47:16.854700
<type 'datetime.timedelta'>
但是结果是不同类型的。
但是,根据 https://pandas.pydata.org/pandas-docs/stable/timeseries.html#timestamp-limitations ,限制是 Timestamp('1677-09-21 00:12:43.145225') ,这不应该是我的情况。
我有 2 个问题:
更新:我发现了 pd.Timedelta https://pandas.pydata.org/pandas-docs/stable/timedeltas.html#timedelta-limitations 的限制第一个问题依然存在。如何克服这个限制?谢谢!
最佳答案
由于存在时间戳的限制,因此通过迭代进行减法,即
df_test.apply(lambda x : x['Mention Date'] - x['Publication Date'],1)
0 121154 days, 12:47:06
1 989 days 12:47:06
2 106545 days 12:47:06
3 106751 days 23:47:16.854700
4 106752 days, 0:00:00
应该被视为错误吗?不,自从 pandas 社区特别提到以来,
由于 pandas 表示纳秒分辨率的时间戳,因此使用 64 位整数可以表示的时间跨度仅限于大约 584 年:。这是矢量化操作的正当理由
关于python - Pandas Timedelta 在应该为正的地方却是负的,如何克服限制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47907967/
将标准 timedelta 字符串转换为 timedelta 对象的最简单方法是什么? 我已经打印了几个 timedelta 对象并得到了这些字符串: '1157 days, 9:46:39' '12
我正在尝试将一个 timedelta 对象与另一个对象相除以计算服务器正常运行时间: >>> import datetime >>> installation_date=datetime.dateti
这里我有一个包含日期、时间和一个输入的数据集。这里我想添加特定时间的 timedelta 并添加到日期时间列。 所以这里首先我将指定时间转换为 00:00:00,它将作为开始时间。从那时起,我想添加一
dta_h 是一个 DataFrame,dta_h.Datetime 看起来像这样: 0 2013-03-01 00:00:00 1 2013-02-28 23:00:00 2 20
我想知道 timedelta 有多少小时在白天和夜晚范围内。 时间开始: >>> dt_start = datetime.datetime(2012, 8, 19, 16, 0) 时间停止: >>>
我的 pandas 数据框中的一列表示我用 datetime 计算的时间增量,然后导出到 csv 并读回 pandas 数据框中。现在该列的 dtype 是对象,而我希望它是一个 timedelta,
这是我的代码: import datetime date = datetime.date(2015,10,1) today = datetime..today() oneday = datetime.
我正在尝试通过包含在同一数据框的另一列中的值来增加 pandas 数据框中的日期,如下所示 loans['est_close_date'] = loans['dealdate'] + loans['t
在我为现有数据库编写的 Web 应用程序中,我需要计算现在和存储在数据库中的时间戳之间的差异(在文本字段中,这很愚蠢,我知道)。这是我的 sqlalchemy Ban 类和相关方法。 class Ba
使用 Python 2.6 给定以下代码行,我如何从数据库中的变量动态构建 timedelta 的值? next_alert_date = datetime.strptime(start_due_da
下面是我正在处理的代码。据我所知,没有问题,但是当我尝试运行这段代码时,我收到了一个错误。 import os import datetime def parseOptions(): impo
例子假设对于一个给定的日期,当我们加上timedelta(days=180),并得到新的日期时,是否考虑闰年并计算新的日期?或者我们是否只计算当前日期的闰年,是否 Feb 有 28/29 天,并在 p
不确定如何处理这个问题。 用户提供一个参数,即 program.exe '2001-08-12' 我需要为该参数添加一天 - 这将代表程序另一部分的日期范围。我知道您可以从当天添加或减去,但如何从用户
我正在解决 Exercism.io 千兆秒问题: “计算某人活了 10^9 秒的时刻。” 我的方法是将 datetime 输入转换为时间戳,添加 10**9,然后转换回来。我的答案非常接近,但测试套件
我有一个大型数据库,正在加载到内存缓存中。我有一个过程可以每天迭代数据。 最近这个过程已经开始抛出以下错误: OverflowError: date value out of range对于线 sta
我有一个 时间值(value)存放在一个名为 newTime 的变量中. 当打印 newTime它给了我这样的结果 newTime = 0:07:00女巫很棒,因为我喜欢那样。 但是当保存 newTi
我有一些数据系列,这是一种 timedelta 数据类型。我想将这些 timedelta 绘制成条形图,其中 y 轴应仅以小时为单位而不是其他格式进行标记。以前,当我在 matplotlib 中尝试绘
菜鸟在这里, 我一直试图将军事时间的用户输入呈现为标准时间。代码到目前为止有效,但我需要从结束时间减去 12 小时才能在标准时间显示。我如何使用 datetime.time 做到这一点?另外,我是否需
我有一个 timedelta 数据框 JC time 1 3days 21:02:05 2 1days 23:50:07 3 6days 19:28:36 但我想要 1 93:02:05 2 47:5
我需要在表的一列中保存时间间隔。基于:http://docs.sqlalchemy.org/en/rel_0_8/core/types.html 我可以用 Interval键入。我的数据库是SQLit
我是一名优秀的程序员,十分优秀!