- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我要比较两个数据集。一个是测量的气象值,大约每 15 分钟测量一次,但每小时测量的时间不一致(即 12:03、1:05、2:01 等)。另一个数据集是准确小时位置的建模数据。我想从最接近小时标记的测量数据中提取值,以与建模数据相结合。
我目前将这两个集合都设置为 DataFrame 格式,并创建了一个每小时时间序列用作索引。有谁知道无需循环遍历所有数据即可对齐这些数据的简单方法吗?
谢谢。
使用 df.resample('H', how='ohlc')
方法,我得到以下错误:
Traceback (most recent call last):
File "<pyshell#81>", line 1, in <module>
df.resample('H', how='ohlc')
File "C:\Python33\lib\site-packages\pandas\core\generic.py", line 290, in resample
return sampler.resample(self)
File "C:\Python33\lib\site-packages\pandas\tseries\resample.py", line 83, in resample
rs = self._resample_timestamps(obj)
File "C:\Python33\lib\site-packages\pandas\tseries\resample.py", line 226, in _resample_timestamps
result = grouped.aggregate(self._agg_method)
File "C:\Python33\lib\site-packages\pandas\core\groupby.py", line 1695, in aggregate
return getattr(self, arg)(*args, **kwargs)
File "C:\Python33\lib\site-packages\pandas\core\groupby.py", line 427, in ohlc
return self._cython_agg_general('ohlc')
File "C:\Python33\lib\site-packages\pandas\core\groupby.py", line 1618, in _cython_agg_general
new_blocks = self._cython_agg_blocks(how, numeric_only=numeric_only)
File "C:\Python33\lib\site-packages\pandas\core\groupby.py", line 1656, in _cython_agg_blocks
result, _ = self.grouper.aggregate(values, how, axis=agg_axis)
File "C:\Python33\lib\site-packages\pandas\core\groupby.py", line 818, in aggregate
raise NotImplementedError
NotImplementedError
我的数据框示例如下所示:
D
2008-01-01 00:01:00 274.261108
2008-01-01 00:11:00 273.705566
2008-01-01 00:31:00 273.705566
2008-01-01 00:41:00 273.705566
2008-01-01 01:01:00 273.705566
2008-01-01 01:11:00 273.705566
2008-01-01 01:31:00 273.705566
2008-01-01 01:41:00 273.705566
2008-01-01 02:01:00 273.705566
2008-01-01 02:11:00 273.149994
编辑: 使用 python 3.3 时,这似乎是一个错误。谁能证实这一点?
最佳答案
我认为pandas.DataFrame.resample()是你在这里需要的。你可以查一下method of resampling例如,您想要检查“ohlc”:
>>> df = pd.DataFrame({'data':[1,4,3,2,7,3]}, index=pd.DatetimeIndex(['2013-11-05 12:03', '2013-11-05 12:14','2013-11-05 12:29','2013-11-05 12:46','2013-11-05 13:01','2013-11-05 13:16']))
>>> df.resample('H', how='ohlc')
data
open high low close
2013-11-05 12:00:00 1 4 1 2
2013-11-05 13:00:00 7 7 3 3
在那之后,您需要做的就是使用 pandas.DataFrame.join() .
更新 很奇怪,在你的DataFrame上试过了:
>>> df = pd.DataFrame({'D':[274.261108,273.705566,273.705566,273.705566,273.705566,273.705566,273.705566,273.705566,273.705566,273.149994]})
>>> df.index = pd.DatetimeIndex(['2008.01.01 00:01:00','2008.01.01 00:11:00','2008.01.01 00:31:00','2008.01.01 00:41:00','2008.01.01 01:01:00','2008.01.01 01:11:00','2008.01.01 01:31:00','2008.01.01 01:41:00','2008.01.01 02:01:00','2008.01.01 02:11:00'])
>>> df.resample('H', how='ohlc')
D
open high low close
2008-01-01 00:00:00 274.261108 274.261108 273.705566 273.705566
2008-01-01 01:00:00 273.705566 273.705566 273.705566 273.705566
2008-01-01 02:00:00 273.705566 273.705566 273.149994 273.149994
工作正常。
关于python - 按小时对齐两个时间序列数据集(Python、Pandas),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19796111/
我有 0 小时、3 小时、12 小时、24 小时、48 小时的数据组……我想绘制这些数据的图表,以便保留时间的比例。 runs <- c(1:25) hours <- as.factor(c(0, 3
例如,如果我选择了时间:下午 3 点和小时数:5 小时,则得到 (8pm) 作为答案“ 最佳答案 let calendar = Calendar.current let date = calendar
我有一个包含两个日期时间字段的表单。用户输入日期 (yyyy-mm-dd) 和时间(3 个框;小时、分钟、上午/下午)。 出于某种原因,第一个没有保存为 24 小时制。 以下数据为输入结果: 2011
我一直在尝试使用导出单位进行计算,但到目前为止我还没有取得任何成果。 我已经尝试过mathjs ,但如果我输入 1 小时 * 1 英里/小时,我会得到 UnsupportedTypeError: Fu
我有两组要运行的 cronjob。第一个应该每 3 小时运行一次,第二个也应该每 3 小时运行一次,但比第一组晚一个小时。什么是正确的语法? // every 3 hours 17 */3 * *
我知道 AWS 中的预留实例更多的是计费而不是实际实例——它们没有附加到实际实例——我想知道: 如果我在特定区域和可用区中购买特定时间的预留实例 - 如果我每天 24 小时使用单个实例与运行 24 个
我试过: seq( from=as.POSIXct("2012-1-1 0", tz="UTC"), to=as.POSIXct("2012-1-3 23", tz="UTC"),
我有一个带有“日期”列的表。我想按小时分组指定日期。 最佳答案 Select TO_CHAR(date,'HH24') from table where date = TO_DATE('2011022
我知道如何在 SQL (SQL Server) 中获取当前日期,但要获取当天的开始时间: select dateadd(DAY, datediff(day, 0, getdate()),0) (res
我正在尝试在游戏之间创建一个计时器,以便用户在失去生命后必须等待 5 分钟才能再次玩游戏。但是我不确定最好的方法是什么。 我还需要它来防止用户在“设置”中编辑他们的时间。 实现这一目标的最佳方法是什么
我的查询有误。该错误显示预期的已知函数,得到“HOUR”。如果我删除这部分,查询将正常工作 (AND HOUR({$nowDate}) = 11) SELECT c FROM ProConvocati
var d1 = new Date(); var d2 = new Date(); d2.setHours(d1.getHours() +01); alert(d2); 这部分没问题。现在我试图在 (
我正在构建一个用于练习的基本时钟应用程序,但出于某种原因,时间不会自动更改为最新的分钟或小时。例如,当前时间是 17:56,但它显示的是 17:54,这是我打开应用程序的最后时间。 NSDate *n
我创建了一张图片,我想将其用作页面的 hr。当它被上传时,它一直向左对齐。我希望它居中,在标题下。这是我的 CSS 代码: .section-underline { height: 35px
这个问题已经有答案了: Getting difference in seconds from two dates in JavaScript (2 个回答) 已关闭 4 年前。 我想计算两个具有不同格
我需要计算到某个日期/时间的剩余时间(天/小时)。 但是,我没有使用静态日期。 假设我在 每个星期日 的 17:00 有一个事件。我需要显示到下一个事件的剩余时间,即即将到来的星期日 17:00。 我
我正在执行这个脚本: SELECT EXTRACT(HOUR FROM TIMEDIFF('2009-12-12 13:13:13', NOW())); 我得到:-838。这是提取时 MySQL 可以
复制代码 代码如下: /** * 小时:分钟的正则表达式检查<br> * <br> * @param pInput 要检查的字符串 * @return boolean 返
连wifi5元/小时 独领风骚 朕好帅 今晚你是我的人 十里桃花 高端定制厕所VP专用 一只老母猪 在家好无聊 你爹的wifi 密码是叫爸爸全拼 关晓彤和鹿晗分手了吗 蹭了我的
我有以下数据框列: 我需要将 csv 列中的对象字符串数据转换为总秒数。 示例:10m -> 600s 我试过这段代码: df.duration = str(datetime.timedelta(df
我是一名优秀的程序员,十分优秀!