- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一些相似时期的数据集。是当时人的呈现,时间大概一年。数据不是定期收集的,而是相当随机的:每年 15-30 个条目,来自 5 个不同的年份。
根据每年的数据绘制的图表大致如下: 用 matplotlib 制作的图表。我有 datetime.datetime, int
格式的数据。
是否有可能以任何明智的方式预测 future 的结果?我最初的想法是计算所有以前出现的平均值并预测它会是这个。不过,这并没有考虑当年的任何数据(如果它一直高于平均水平,猜测可能会略高)。
数据集和我的统计知识有限,所以每一个见解都是有帮助的。
我的目标是首先创建一个原型(prototype)解决方案,尝试我的数据是否足以满足我正在尝试做的事情,在(可能的)验证之后,我会尝试一种更完善的方法。
编辑:不幸的是,我从来没有机会尝试收到的答案!我仍然很好奇这种数据是否足够并且如果有机会我会记住这一点。谢谢大家的回答。
最佳答案
在您的案例中,数据变化很快,您可以立即观察到新数据。可以使用 Holt-winter 实现快速预测。指数平滑。
更新方程:
m_t
是您拥有的数据,例如每次 t
的人数。 v_t
是一阶导数,即 m
的趋势。 alpha
和 beta
是两个衰减参数。顶部带有 波浪号
的变量表示预测值。在维基百科页面查看算法的详细信息。
由于您使用 python
,我可以向您展示一些示例代码来帮助您处理数据。顺便说一句,我使用了一些合成数据如下:
data_t = range(15)
data_y = [5,6,15,20,21,22,26,42,45,60,55,58,55,50,49]
data_t
之上是一系列从时间0开始的连续数据点; data_y
是每次演示中观察到的人数序列。
数据如下所示(我试图使其接近您的数据)。
该算法的代码很简单。
def holt_alg(h, y_last, y_pred, T_pred, alpha, beta):
pred_y_new = alpha * y_last + (1-alpha) * (y_pred + T_pred * h)
pred_T_new = beta * (pred_y_new - y_pred)/h + (1-beta)*T_pred
return (pred_y_new, pred_T_new)
def smoothing(t, y, alpha, beta):
# initialization using the first two observations
pred_y = y[1]
pred_T = (y[1] - y[0])/(t[1]-t[0])
y_hat = [y[0], y[1]]
# next unit time point
t.append(t[-1]+1)
for i in range(2, len(t)):
h = t[i] - t[i-1]
pred_y, pred_T = holt_alg(h, y[i-1], pred_y, pred_T, alpha, beta)
y_hat.append(pred_y)
return y_hat
好的,现在让我们调用我们的预测器并根据观察结果绘制预测结果:
import matplotlib.pyplot as plt
plt.plot(data_t, data_y, 'x-')
plt.hold(True)
pred_y = smoothing(data_t, data_y, alpha=.8, beta=.5)
plt.plot(data_t[:len(pred_y)], pred_y, 'rx-')
plt.show()
红色表示每个时间点的预测结果。我将 alpha
设置为 0.8,这样最近的观察确实会对下一次预测产生很大影响。如果您想赋予历史数据更多权重,只需使用参数 alpha
和 beta
。另请注意,t=15
处红线上最右边的数据点是最后的预测,我们还没有观察到。
顺便说一句,this远非完美的预测。这只是您可以快速开始的事情。这种方法的缺点之一是您必须能够获得观察结果,否则预测会越来越偏离(可能所有实时预测都是如此)。希望能帮助到你。
关于python - 从上一个日期 :value data 开始预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11845055/
我的数据库中有两张表,一张用于 field ,另一张用于预订。我需要的是一个查询来选择所有未预订的 field 。见下文: 餐 table 预订具有以下字段: bk_id venue_id 作为(预订
嗨,我是编码新手,我有一些培训项目,其中包括从 HTML 表单输入 MySQL 数据库。它就像你玩过的游戏的日志。第一个日期输入是您开始游戏的时间,第二个日期输入是您完成游戏的时间。但我需要检查器或类
我是这个 sql 编码的新手,我正在尝试学习新的东西。因此,我创建了一个交货表,其中包含一些属性,如商品代码、交货日期、交货数量。所以如何从同一张表中获取第一个交货日期(最小日期)和交货数量以及最晚交
我从支付网关返回了这个日期 2014-05-15T08:40:52+01:00 我得到 2014-05-15T08:40:52 但我无法识别时区 +01:00 的含义 我的位置时区是 UTC−06:0
我快要疯了,请帮忙。 我有一列包含日期时间值。 我需要找到每天的最小值和最大值。 数据看起来像这样 2012-11-23 05:49:26.000 2012-11-23 07:55:43.000
我从 json 数据中获取日期为 2015 年 4 月 15 日晚上 10:15我只想在 html 页面中显示 json 响应数据的时间,例如 10:15 PM这里我放了我的js函数和html代码 J
是否有 javascript 库或其他机制允许我将 .NET 日期/时间格式字符串(即 yyyy-MM-dd HH:mm:ss)传递给 javascript函数并让它相应地解析提供的日期时间值?我一直
我正在使用以下代码以正确的格式获取当前的 UTC 时间,但客户返回并要求时间戳现在使用 EST 而不是 UTC。我搜索了 Google 和 stackoverflow,但找不到适用于我现有代码的答案。
我有以下日期的平均温度数据。我想找到连续至少 5 天低于或高于 0 摄氏度的开始日期。 date_short mean.temp 1 2018-05-18 17.54 2 2018-05-19
它可以在其他网络浏览器中使用,但 IE11 返回无效日期。 为了调试我使用了下面的代码。 console.log('before - ' + date.value); date.value = new
我在 Excel 中有一个数据的 Web 提取,其中日期列带有/Date(1388624400000)/。我需要在 Excel 中将其转换为日期。 最佳答案 能够从 here 中推断出它. 假设字符串
嗨,我的 Schmema 有一个带有 ISO 日期的字段: ISODate("2015-04-30T14:47:46.501Z") Paypal 在成功付款后以该形式返回日期对象: Time/Date
我的 table : CREATE TABLE `tbdata` ( `ID` INT(10) NOT NULL AUTO_INCREMENT, `PatientID` INT(10) NOT
我正在 Ubuntu 服务器 12.04 中编写一个 shell 脚本,它应该比较日志文件中的一些数据。在日志文件中,日期以以下格式给出: [Mon Apr 08 15:02:54 2013] 如您所
我想使用 GROUP BY WITH ROLLUP 创建一个表并获取总行数而不是 null。 $sql ="SELECT IF(YEAR(transaktioner.datum
我正在创建博客文章,在成功迁移我的博客文件后,当我转到我网站的博客页面时返回一个错误(无法解析其余部分:':“Ymd”'来自'post.date|date: "Ymd"') 我似乎无法确定这是语法错误
我正在尝试获取要插入到 CAML 查询中的月份范围,即:2010-09-01 和 2010-09-30。 我使用以下代码生成这两个值: var month = "10/2010"; var month
如何将代码document.write("直到指定日期")更改为writeMessage(date)中的日期?此外,writeMessage(date) 中的日期未正确显示(仅显示年份)。感谢您帮助解
我在 Windows (XP) 和 Linux 上都尝试过 utime()。在 Windows 上我得到一个 EACCES 错误,在 Linux 上我没有得到任何错误(但时间没有改变)。我的 utim
我正在尝试计算发生在同一日期的值的总和(在 XYZmin 中)。 我的数据看起来像这样, bar <- structure(list(date = structure(c(15622, 15622,
我是一名优秀的程序员,十分优秀!