大家好:
我們時常會用log、BoxCox、差分來使時間序列資料趨於穩定,好讓它滿足ARIMA模型的使用前提,但為什麼建模、找參數時,是用原始資料呢? 那剛剛轉換、差分的資料是用於?
以下是我的coding(來自眾多網站貼文)~ ps:資料是亂key的
資料載點 逐月營收(非穩): https://drive.google.com/drive/u/1/folders/1bvkCAR6AKXIunw7tVmMMTEnRtpAFjuQJ
library(forecast)#AUTO-ARIMA
library(tseries) #adf kpss test
data <- read.csv(file="C:\\逐月營收(非穩).csv",header=TRUE,sep=",")
時序格式 <- ts(data$含稅金額, frequency=12, start=c(2012,01))
拆解 <- decompose(時序格式)
plot(拆解)
adf.test(時序格式) #不穩定,轉換or差分
差分且轉換 <- diff(BoxCox(時序格式,lambda = "auto"),differences = 1)
adf.test(差分且轉換) #穩定
auto.arima(時序格式,stepwise = F,trace = T,stationary = T)
fit <- arima(時序格式,order=c(2,0,0))
auto.arima 、 fit 這邊充滿疑惑: