如何将多个时间序列数据呈现给R中的SVM(ksvm)(或者,如何将二维输入数据呈现给SVM)

如何让ksvm模型知道数据集中的前100个数字是来自一个传感器的所有时间序列数据,而接下来的100个数字是来自另一个传感器等的所有时间序列数据,用于六个独立的时间序列传感器输入？或者(也许更一般地),如何向SVM呈现二维输入数据？

我需要二进制是/否预测模型的过程具有六个非周期时间序列输入,所有输入具有相同的采样频率.事件触发数据收集的开始,并且在预定时间之后我需要是/否预测(优选地包括正确性概率输出).应该产生"是"与"否"的时间序列输入的特征是未知的,但是已知的是在每个输入时间序列数据和最终结果之间应该存在某种相关性.所有输入都存在明显的噪音.有意义的信息和噪声都作为短持续时间突发出现在输入上(有意义的突发总是在给定输入源的相同的一般时间内),但是识别哪些突发是有意义的以及哪些是噪声是困难的; 即,对于一个输入在"正确"时间发生突发的事实不一定表示"是"输出; 它可能只是噪音.要知道预测是否应为"是",模型需要以某种方式合并来自所有六个时间序列输入的信息.我收集了大约900'不'结果和100'是'结果的先前数据.

我对R和SVM 都很陌生,但我想我想使用SVM模型(kernlab的ksvm).我无法弄清楚如何向其提供输入数据.我也不知道如何告诉ksvm数据是时间序列数据,或者是否相关.我尝试使用Rattle GUI前端来从R中提取我的数据来自csv文件,但我无法弄清楚如何将所有六个输入的时间序列数据呈现到ksvm模型中.作为csv文件输入,似乎导入所有1000个样本的数据的唯一方法是组织输入数据,使得所有样本数据(对于所有六个时间序列输入)都在csv文件的单行上,在csv文件的每一行上显示单独的已知结果文件的数据.但是这样做,第一个,第二个,第三个等数字是来自第一个传感器的时间序列数据的每个部分的事实在翻译中丢失,以及第101,102,123等事实数字是来自第二传感器的时间序列数据的每一部分,依此类推; 对于ksvm模型,每个数据样本只被认为是与其邻居无关的孤立数字.如何将这些数据作为六个独立但相互关联的时间序列数组提供给ksvm？或者我如何向ksvm提供二维数据数组？

更新:

好吧,有两个基本的策略我尝试过惨淡的结果(好吧,结果模型比盲猜更好,但不多).

首先,不熟悉R,我使用了Rattle GUI前端到R.我有一种感觉,通过这样做,我可能会限制我的选择.但无论如何,这就是我所做的......

示例已知结果文件(仅显示4个传感器而不是6个传感器,仅显示7个时间样本而不是100个):

training168_yes.csv

Seconds Since 1/1/2000,sensor1,sensor2,sensor3,sensor4
454768042.4,           0,      0,      0,      0
454768042.6,           51,     60,     0,      172
454768043.3,           0,      0,      0,      0
454768043.7,           300,    0,      0,      37
454768044.0,           0,      0,      1518,   0
454768044.3,           0,      0,      0,      0
454768044.7,           335,    0,      0,      4273

标签: kernlab

model1使用e1071

model2使用插入符号

model1(e1071)

model2(插入符号)

标签 统计

标签统计