- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试(第一次)使用 add_regressor
函数向 prophet 添加一个外部变量,但我得到的结果看起来很奇怪。我使用的数据集可在 kaggle(众所周知的洗发水销售)上免费获得 here .我正在尝试使用 R 的 quantmod
包作为我的外部变量,为 SPY 股票指数使用免费可用的数据。
下面是我如何开始代码:
library(prophet)
library(quantmod)
library(dplyr)
df <- read.csv("~/shampoo.csv")
#now get the min and max dates in the column
min_date <- min(df$Date, na.rm = TRUE)
max_date <- max(df$Date, na.rm = TRUE)
#download the SPY stock data
getSymbols("SPY", from = min_date, to = max_date)
#SPY closes stored into a df and massage a bit
Close <- data.frame(Cl(SPY))
Close <- cbind(ds = rownames(Close), Close)
rownames(Close) <- NULL
Close_no_rename <- Close
colnames(Close)[colnames(Close) == 'SPY.Close'] <- 'y'
colnames(Close_no_rename)[colnames(Close_no_rename) == 'SPY.Close'] <- 'SPY_CLOSE'
#now put this into prophet and make a forecast for the forecast_period for SPY
stock_model <- prophet(Close)
#make a forecast dataframe
future_stocks <- make_future_dataframe(stock_model, periods = 30, freq = "month", include_history = FALSE)
#the below df will have predicted stock prices of the SPY. want to extract the future y values as point forecast along with dates
forecast <- predict(stock_model, future_stocks) %>% select(ds, yhat)
colnames(forecast)[colnames(forecast) == 'yhat'] <- 'SPY_CLOSE'
#rename the columns of the actual df
colnames(df)[colnames(df) == 'Date'] <- 'ds'
colnames(df)[colnames(df) == 'Value'] <- 'y'
#now want to merge the Close df y historic values onto the training df, merge by date ds column
df_historic_with_SPY_close <- merge(df, Close_no_rename, by = "ds")
#now actually forecast using prophet
model <- prophet()
#add the SPY regressor
model <- add_regressor(model, 'SPY_CLOSE', prior.scale = 0.0000001, standardize = FALSE)
model <- fit.prophet(model, df_historic_with_SPY_close)
forecast_final <- predict(model, forecast)
plot(model, forecast_final)
这不会引发任何错误,但预测图看起来......错误。看起来好像秤不对或什么的。我尝试摆弄先前的设置并标准化设置,但没有成功。谢谢你的帮助!
这里是用作主要变量的洗发水数据集:
Date Value
2017-01-01 266
2017-02-01 145.9
2017-03-01 183.1
2017-04-01 119.3
2017-05-01 180.3
2017-06-01 168.5
2017-07-01 231.8
2017-08-01 224.5
2017-09-01 192.8
2017-10-01 122.9
2017-11-01 336.5
2017-12-01 185.9
2018-01-01 194.3
2018-02-01 149.5
2018-03-01 210.1
2018-04-01 273.3
2018-05-01 191.4
2018-06-01 287
2018-07-01 226
2018-08-01 303.6
2018-09-01 289.9
2018-10-01 421.6
2018-11-01 264.5
2018-12-01 342
2019-01-01 339.7
2019-02-01 440.4
2019-03-01 315.9
2019-04-01 439.3
2019-05-01 401.3
2019-06-01 437.4
2019-07-01 575.5
2019-08-01 407.6
2019-09-01 682
2019-10-01 475.3
2019-11-01 581.3
2019-12-01 646.9
最佳答案
我想我已经修复了一些问题,但我唯一不同的是将日期从因子格式更改为日期格式,并告诉 R 使用 dplyr 中的选择函数。我也在没有加载任何其他包的情况下运行 R。因此,这为何有效仍然是个谜。
当行时,我遇到了这个问题
df_historic_with_SPY_close <- merge(df, Close_no_rename, by = "ds")
没有正常工作。我发现这是因为我已将 df 日期格式化为日期以使它们与 getSymbols
一起使用,但它们与 Close_no_rename 不同。
首先是我使用的数据:
df<-dput(df)
structure(list(ds = structure(c(17167, 17198, 17226, 17257, 17287,
17318, 17348, 17379, 17410, 17440, 17471, 17501, 17532, 17563,
17591, 17622, 17652, 17683, 17713, 17744, 17775, 17805, 17836,
17866, 17897, 17928, 17956, 17987, 18017, 18048, 18078, 18109,
18140, 18170, 18201, 18231), class = "Date"), y = c(266, 145.9,
183.1, 119.3, 180.3, 168.5, 231.8, 224.5, 192.8, 122.9, 336.5,
185.9, 194.3, 149.5, 210.1, 273.3, 191.4, 287, 226, 303.6, 289.9,
421.6, 264.5, 342.3, 339.7, 440.4, 315.9, 439.3, 401.3, 437.4,
575.5, 407.6, 682, 475.3, 581.3, 646.9)), row.names = c(NA, -36L
), class = "data.frame")
library(prophet)
library(quantmod)
library(dplyr)
# can use your df, rather than above
df<-read.csv("~/shampoo.csv")
# either way, should run this
df$Date<-as.Date.factor(df$Date,tryFormats = c("%d-%m-%y"))
str(df) #check
#now get the min and max dates in the column
min_date <- min(df$Date, na.rm = TRUE)
max_date <- max(df$Date, na.rm = TRUE)
#download the SPY stock data
getSymbols("SPY", from = min_date, to = max_date)
#SPY closes stored into a df and massage a bit
Close <- data.frame(Cl(SPY))
Close <- cbind(ds = rownames(Close), Close)
rownames(Close) <- NULL
Close_no_rename <- Close
colnames(Close)[colnames(Close) == 'SPY.Close'] <- 'y'
colnames(Close_no_rename)[colnames(Close_no_rename) == 'SPY.Close'] <- 'SPY_CLOSE'
# make dates in date format
Close_no_rename$ds<-as.Date(Close_no_rename$ds)
str(Close_no_rename)
#now put this into prophet and make a forecast for the forecast_period for SPY
stock_model <- prophet(Close)
#make a forecast dataframe
future_stocks <- make_future_dataframe(stock_model, periods = 30, freq = "month", include_history = FALSE)
#the below df will have predicted stock prices of the SPY. want to extract the future y values as point forecast along with dates
# specify dplyr:::select
forecast <- predict(stock_model, future_stocks) %>% dplyr:::select(ds, yhat)
colnames(forecast)[colnames(forecast) == 'yhat'] <- 'SPY_CLOSE'
#rename the columns of the actual df
colnames(df)[colnames(df) == 'Date'] <- 'ds'
colnames(df)[colnames(df) == 'Value'] <- 'y'
#now want to merge the Close df y historic values onto the training df, merge by date ds column
df_historic_with_SPY_close <- merge(df, Close_no_rename, by = "ds")
df_historic_with_SPY_close
#now actually forecast using prophet
model <- prophet()
#add the SPY regressor
model <- add_regressor(model, 'SPY_CLOSE', prior.scale = 0.0000001, standardize = FALSE)
model <- fit.prophet(model, df_historic_with_SPY_close)
forecast_final <- predict(model, forecast)
plot(model, forecast_final)
结果:
使用以下数据集,日期更改为 SPY 数据集中接近的日期:
df<-dput(df)
structure(list(ds = structure(c(17169, 17198, 17226, 17259, 17287,
17318, 17350, 17379, 17410, 17442, 17471, 17501, 17534, 17563,
17591, 17624, 17652, 17683, 17715, 17744, 17778, 17805, 17836,
17868, 17898, 17928, 17956, 17987, 18017, 18050, 18078, 18109,
18142, 18170, 18201, 18232), class = "Date"), y = c(266, 145.9,
183.1, 119.3, 180.3, 168.5, 231.8, 224.5, 192.8, 122.9, 336.5,
185.9, 194.3, 149.5, 210.1, 273.3, 191.4, 287, 226, 303.6, 289.9,
421.6, 264.5, 342.3, 339.7, 440.4, 315.9, 439.3, 401.3, 437.4,
575.5, 407.6, 682, 475.3, 581.3, 646.9)), class = "data.frame", row.names = c(NA,
-36L))
我们得到这个,看起来好多了:
问题与缺失数据有关。洗发水数据集中的某些日期不在 SPY 数据集中。下面将在SPY数据集中选取最近日期的数据来克服数据缺失的问题。但是,它生成的图表看起来仍然很奇怪,并且稍微更改日期似乎是问题的原因。
替换行:
df_historic_with_SPY_close <- merge(df, Close_no_rename, by = "ds")
与(归功于 https://stackoverflow.com/a/28073823/7967291 ):
library(data.table)
setDT(Close_no_rename)
setDT(df)
setkey(Close_no_rename, ds)[, dateMatch:=ds]
df_historic_with_SPY_close<-Close_no_rename[df, roll='nearest']
df_historic_with_SPY_close<-setDT(df_historic_with_SPY_close)[,-1]
names(df_historic_with_SPY_close)[names(df_historic_with_SPY_close) == "dateMatch"] <- "ds"
df_historic_with_SPY_close
df_historic_with_SPY_close <- mutate ( df_historic_with_SPY_close, ds = ymd(ds) )
str(df_historic_with_SPY_close)
关于R Prophet add_regressor 给出奇怪的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59062540/
我有这种来自 Google map 自动完成的奇怪行为(或者我可能错过了某事)...想法?奇怪的: 您在输入中输入某物,例如“伦敦” 您按 [ENTER] 你按下 [CLEAR] 按钮 你点击进入'输
这段代码与《Learning Java》(Oracle Press Books)一书中的代码完全一样,但它不起作用。我不明白为什么它不起作用,它应该起作用。我用 OpenJDK 和 Sun JDK 7
示例 1 中究竟发生了什么?这是如何解析的? # doesnt split on , [String]::Join(",",("aaaaa,aaaaa,aaaaa,aaaaa,aaaaa,aa
我需要获得方程式系统的解决方案。为此,我使用函数sgesv_()。 一切都很好,它使我感到解决方案的正确结果。 但是我得到一个奇怪的警告。 警告:从不兼容的指针类型传递'sgesv_'的参数3 我正在
我目前在制作动画时遇到一个奇怪的问题: [UIView animateWithDuration:3 delay:0
alert('works'); $(window).load(function () { alert('does not work'); });
我的代码: public class MyTest { public class StringSorter implements Comparator { public
我正在学习 JavaScript。尝试理解代码, function foo (){ var a = b = {name: 'Hai'}; document.write(a.name +''
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
这按预期工作: [dgorur@ted ~]$ env -i env [dgorur@ted ~]$ 这样做: [dgorur@ted ~]$ env -i which date which: no
struct BLA { int size_; int size()const{ return size_; } } int x; BLA b[ 2 ]; BLA * p = &b[
我有以下代码: #test img {vertical-align: middle;} div#test { border: 1px solid green; height: 150px; li
我想大多数使用过 C/C++ 的人都对预处理器的工作原理有一定的直觉(或多或少)。直到今天我也是这么认为的,但事实证明我的直觉是错误的。故事是这样的: 今天我尝试了一些东西,但我无法解释结果。首先考虑
我想为 TnSettings 做 mock,是的,如果通过以下方法编写代码,它就可以工作,问题是我们需要为每个案例编写 mock 代码,如果我们只 mock 一次然后执行多个案例,那么第二个将报告异常
我的项目中有以下两个结构 typedef volatile struct { unsigned char rx_buf[MAX_UART_BUF]; //Input buffer over U
Regex rx = new Regex(@"[+-]"); string[] substrings = rx.Split(expression); expression = "-9a3dcb
我的两个应用程序遇到了一个奇怪的问题。这是设置: 两个 tomcat/java 应用程序,在同一个网络中运行,连接到相同的 MS-SQL-Server。一个应用程序,恰好按顺序位于 DMZ 中可从互联
我目前正在与 Android Api Lvl 8 上的 OnLongClickListener 作斗争。 拿这段代码: this.webView.setOnLongClickListener(new
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
只是遇到了奇怪的事情。我有以下代码: -(void)ImageDownloadCompleat { [self performSelectorOnMainThread:@selector(up
我是一名优秀的程序员,十分优秀!