我正在尝试使用基于每周数据的R进行时间序列建模和预测,如下所示:
biz week Amount Count
2006-12-27 973710.7 816570
2007-01-03 4503493.2 3223259
2007-01-10 2593355.9 1659136
2007-01-17 2897670.9 2127792
2007-01-24 3590427.5 2919482
2007-01-31 3761025.7 2981363
2007-02-07 3550213.1 2773988
2007-02-14 3978005.1 3219907
2007-02-21 4020536.0 3027837
2007-02-28 4038007.9 3191570
2007-03-07 3504142.2 2816720
2007-03-14 3427323.1 2703761
...
2014-02-26 99999999.9 1234567
Run Code Online (Sandbox Code Playgroud)
关于我的数据:如上所示,每周都标有一周的第一天(我的周从周三开始,到周二结束).当我构建我的ts对象时,我尝试了
ts <- ts(df, frequency=52, start=c(2007,1))
Run Code Online (Sandbox Code Playgroud)
我遇到的问题是:
1)有些年份可能有53周,因此frequency=52这些年不适用;
2)我的开始周/日期是2006-12-27,我该如何设置启动参数?start=c(2006,52)或者start=c(2007,1)自2006-12-27周以来真的跨过年界?另外,对于建模,最好是拥有完整的年份数据(比如2007年我的开始年份,如果我只有部分年份的数据),最好不要使用2007,而是从2008年开始?那么2014年:既然还不是完整的一年,我应该使用我的建模吗?无论哪种方式,我仍然有一个问题,是否在2006-12-27这样的年份边界中包括那些周.我应该包括wk 12007年还是2006年的最后一周?
3)当我使用ts <- ts(df, frequency=52, start=c(2007,1)),然后打印出来,我得到了如下图所示的结果,这样反而2007.01,2007.02,2007.52 ...,我得到了2007.000,2007.019,...,它从获取1/52=0.019.这在数学上是正确的,但不容易解释.有没有办法将它标记为日期本身就像数据框或至少一样2007 wk1, 2007 wk2...
========= …