如何进行时间序列简单预测？

Question

如何进行时间序列简单预测？

rus*_*sty 9 scala time-series apache-spark

我有一个时间序列的单变量数据.所以只是TimeStamp和Value.现在我想推断(预测)第二天/月/年的这个值.我知道有Box-jenkins(ARIMA)等方法.

Spark有线性回归,我尝试过,但是没有得到满意的结果.有没有人在Spark中尝试过时间序列的简单预测.可以分享实施方法吗？

PS:我在用户邮件列表中检查了这个问题,几乎所有关于这个问题的问题都没有得到答复.

Answer 1

hui*_*ker 7

你可以看一下Cloudera的时间序列库:https: //github.com/cloudera/spark-timeseries

它确实包括ARIMA.您还可以查看介绍它的博客文章:https: //blog.cloudera.com/blog/2015/12/spark-ts-a-new-library-for-analyzing-time-series-data-与-apache的火花/

Answer 2

小智 2

是的，我已经在 Spark 中应用了 ARIMA 来处理单变量时间序列。

public static void main(String args[])
{
    System.setProperty("hadoop.home.dir", "C:/winutils");  

     SparkSession spark = SparkSession
              .builder().master("local")
              .appName("Spark-TS Example")
              .config("spark.sql.warehouse.dir", "file:///C:/Users/abc/Downloads/Spark/sparkdemo/spark-warehouse/")
              .getOrCreate();

    Dataset<String> lines = spark.read().textFile("C:/Users/abc/Downloads/thunderbird/Time series/trainingvector_arima.csv");

    Dataset<Double> doubleDataset = lines.map(line>Double.parseDouble(line.toString()),
            Encoders.DOUBLE());

    List<Double> doubleList = doubleDataset.collectAsList();
    //scala.collection.immutable.List<Object> scalaList = new

    Double[] doubleArray = new Double[doubleList.size()];
    doubleArray = doubleList.toArray(doubleArray);

    double[] values = new double[doubleArray.length];
    for(int i = 0; i< doubleArray.length; i++)
    { 
        values[i] = doubleArray[i];
    }

    Vector tsvector = Vectors.dense(values);

    System.out.println("Ts vector:" + tsvector.toString());

    //ARIMAModel arimamodel = ARIMA.fitModel(1, 0, 1, tsvector, true, "css-bobyqa", null);
    ARIMAModel arimamodel = ARIMA.autoFit(tsvector, 1, 1, 1);

    Vector forcst = arimamodel.forecast(tsvector, 10);

    System.out.println("forecast of next 10 observations: " + forcst);
   }

Run Code Online (Sandbox Code Playgroud)

这段代码对我有用。您想要预测的任何值都将作为输入数据传递。

归档时间：	11 年前
查看次数：	7945 次
最近记录：	9 年，1 月前